﻿N NILSON INTELIGENŢĂ ARTIFICIALĂ METODE DE CĂUTARE SOLUȚII Tradus din engleză de V L Stefanyuk Editat de S V Fomin EDITURA "MIR" MOSCOVA UDC - , Cartea lui Nilson este scrisă ca un manual despre metodele de soluții în spațiul de stat, un subiect major în cercetarea inteligenței artificiale Prezintă principalele rezultate teoretice și, pentru a le ilustra, analizează numeroase exemple de rezolvare a problemelor - jocul lui , jocul tic-tac-tou, problema vânzătorului ambulant, problema piramidei, teoreme de demonstrare etc Citirea cărții necesită puține cunoștințe despre teoria grafurilor, combinatorie și calculul predicatelor Accesibilitatea prezentării și sarcinile atent selectate de diferite dificultăți fac cartea utilă studenților și studenților absolvenți specializați în inteligență artificială De asemenea, va fi de interes pentru specialist ca o trecere în revistă detaliată a unui număr mare de lucrări contemporane împrăștiate prin reviste, lucrări ale conferințelor și rapoarte Colegiul editorial al literaturii în științe matematice - H ( )- Traducere în rusă, Mir, TRADUCERE PREFAȚA EDITORULUI Gama de probleme unite de termenul "inteligență artificială" este destul de largă și destul de vagă În sensul cel mai general, aceasta este soluția problemelor "intelectuale" cu ajutorul metodelor automate, în primul rând cu ajutorul computerelor Dar ce fel de activitate ar trebui considerată intelectuală și ce nu? Acest lucru nu este complet clar De exemplu, suntem obișnuiți să considerăm rezolvarea unor probleme complexe de calcul ca pe o activitate, fără îndoială, intelectuală Pentru experții în inteligență artificială, poate, studiul jocului de dame sau "tic-tac-toe" va fi de mare interes decât, să zicem, soluția sistemelor de ecuații diferențiale Și există motive destul de bune pentru asta Faptul este că, dacă pentru o anumită problemă de calcul (cum ar fi rezolvarea ecuațiilor) există un anumit algoritm de soluție, atunci acesta este destul de natural și clar reprezentat de o secvență de operații elementare individuale, care este implementată sub forma unui program adecvat pentru un calculator În ceea ce privește tipurile de activități precum recunoașterea modelelor, diferite tipuri de jocuri, rezolvarea puzzle-urilor etc , pentru ei, dimpotrivă, această împărțire formală a procesului de căutare a soluției în pași elementari separați se dovedește adesea a fi foarte dificilă, chiar dacă soluția lor în sine și nu dificilă Dificultatea de a împărți problemele de calcul în pași elementari este de obicei asociată cu dificultatea unei descrieri formale a acestor probleme De exemplu, o persoană poate distinge o pisică de un câine fără a putea oferi deloc o descriere formală a procedurii de recunoaștere corespunzătoare Multe dintre problemele cu care ne vom confrunta în știință, jocuri și activități practice pot fi, în principiu, rezolvate prin enumerarea unui anumit număr, evident finit de opțiuni și alegând dintre ele opțiunea care este într-un sens sau altul Cel mai bun Cu toate acestea, în situații suficient de interesante și semnificative, o astfel de "enumerare completă" nu este fezabilă, deoarece abundența de opțiuni depășește capacitățile oricărui computer cel mai avansat De exemplu, numărul de poziții diferite în șah, precum și numărul posibilelor jocuri de șah constând dintr-un număr limitat de mutări (să zicem, nu mai mult de ), deși finit, este atât de mare încât nu este posibilă nicio enumerare aici Prin urmare, în astfel de situații, se pune problema găsirii celor mai economice și eficiente modalități de enumerare scurtă, luarea în considerare cu prioritate a celor mai promițătoare căi de rezolvare a problemei etc Cuvânt înainte de către editorul de traduceri Deci, pentru problemele inteligenței artificiale, un rol esențial îl joacă problema descrierii formale a anumitor sarcini formulate informal, metodele de împărțire a acestora în pași elementari separati, precum și organizarea diferitelor proceduri care sunt optime într-un sens sau alta pentru enumerarea optiunilor Tocmai acestor întrebări le este dedicată cartea lui Nilsson, unul dintre membrii de frunte ai Grupului de Inteligență Artificială de la Institutul de Cercetare Stanford Această carte este concepută de autor ca un tutorial despre problemele de căutare euristică Primul capitol, introductiv, oferă o idee generală a gamei de probleme luate în considerare, pe care autorul însuși le caracterizează drept metode euristice pentru găsirea de soluții la probleme Următorul este un rezumat al acestor metode Metodele discutate în capitolele - se bazează în principal pe teoria grafurilor și pe aparatele combinatorii apropiate acesteia Capitolele - folosesc pe scară largă metodele logicii matematice Deși întregul conținut al cărții este axat pe metode automate de enumerare (adică implementate sub formă de programe pentru calculatoare), problemele reale ale programării nu sunt luate în considerare în carte Scopul său este de a oferi abordări logice pentru construirea unor astfel de programe cât mai eficient posibil Cititorul cărții lui Nilson are nevoie de un fundal matematic foarte moderat; în esență, este suficient să stăpânești conceptele teoretice elementare și fundamentele combinatoriei Familiarizarea cu logica matematică este de dorit, dar nu necesară, deoarece informațiile necesare din acest domeniu, precum și elementele de teoria grafurilor utilizate de autor, sunt descrise suficient de detaliat în cartea însăși De regulă, autorul ilustrează rezultatele și metodele prezentate în carte cu exemple model foarte elementare - jocul celor cincisprezece, problema piramidei etc , dar aceste metode în sine sunt aplicabile și la multe probleme de interes științific și practic serios Accesibilitatea prezentării, caracterul comparativ elementar al aparatului și claritatea exemplelor date permit cititorului, care dorește doar să-și facă o idee generală asupra gamei de întrebări luate în considerare, să realizeze acest lucru cu o cheltuială mică de timp si efort În același timp, fără a preveni efortul de a studia cu atenție cartea și, în special, de a analiza problemele puse la sfârșitul fiecărui capitol, cititorul poate realiza mult mai mult - stăpânirea activă a conceptelor și metodelor teoriei moderne a căutării pentru solutii Cartea lui Nilsson merită cu siguranță un studiu atât de atent S V Fomin 'Părinților mei, Walter şi Paulina Nilson CUVÂNT ÎNAINTE Scopul muncii de inteligență artificială este de a crea mașini care efectuează acțiuni care ar necesita în mod normal inteligența umană Principalele domenii de interes în acest domeniu includ metode automate pentru rezolvarea problemelor, "înțelegerea" și traducerea limbilor, demonstrarea teoremelor și recunoașterea vizuală și a vorbirii Deși multe dintre aceste sarcini sunt foarte dificile, au fost deja create mai multe programe de calculator care funcționează la un nivel care se apropie de om Progresele ulterioare în acest domeniu depind atât de dezvoltarea teoriei, cât și de acumularea rezultatelor practice Pe măsură ce practicienii înțeleg din experiența lor cum să construiască sisteme de procesare a informațiilor din ce în ce mai complexe, stocul de tehnici se va extinde Ne putem aștepta ca dezvoltarea tehnologiei calculatoarelor digitale și îmbunătățirea limbilor pentru aceste mașini (în special a limbilor de listă) va continua să servească drept bază pentru obținerea noilor informații practice necesare În ceea ce privește cunoștințele teoretice, există susținători ai unei teorii unificate a inteligenței artificiale Ideea mea este că inteligența artificială este (sau va fi în curând) o disciplină de inginerie, deoarece scopul ei inițial este de a crea structuri Prin urmare, în căutarea unei teorii a inteligenței artificiale, nu există mai mult sens decât în căutarea, să zicem, a unei teorii a ingineriei civile În loc de o singură teorie generală, există o serie de discipline teoretice care aparțin aici și care ar trebui studiate de cei care aleg inteligența artificială ca specialitate Astfel de discipline includ logica matematică, lingvistica structurală, teoria calculului, teoria structurii informației, teoria controlului, teoria clasificării statistice, teoria grafurilor și teoria căutării euristice Ultima dintre aceste discipline, căutarea euristică, este subiectul principal al acestei cărți Rezolvarea problemelor prin direcţionare euristică, încercări şi erori în spaţiul soluţiilor posibile − cuvânt înainte subiect dominant în cercetarea inteligenței artificiale Cu toate acestea, încă nu există un singur manual dedicat explicării ideilor teoretice care stau la baza unor astfel de procese de căutare Lucrarea de față este o încercare de a satisface nevoia unei astfel de cărți Se iau în considerare destul de pe deplin cele mai importante metode de căutare euristică utilizate în soluționarea automată a problemelor, dovada teoriei în situații de joc Aceste metode de căutare sunt explicate pe baza unui singur sistem de concepte; în plus, sunt prezentate câteva rezultate teoretice privind proprietățile căutării euristice Deși aplicarea eficientă a metodelor de căutare euristică în probleme mari "practice" este abia la început, cu toate acestea, în multe cazuri acestea au fost utilizate cu succes în probleme incomparabil mai complexe decât cele selectate în carte ca exemple Am menționat câteva dintre aceste aplicații, dar cred că sunt multe altele Cartea cuprinde trei capitole legate de demonstrarea teoremelor în calculul predicatelor bazate pe principiul construcției de soluții și aplicarea acestuia la rezolvarea de probleme Și deși această abordare nu și-a găsit încă o aplicație practică, dar, cred că în cele din urmă vor apărea astfel de aplicații Întrucât majoritatea literaturii despre acest subiect este foarte greu de citit, mi s-a părut util să încerc să fac o prezentare destul de simplă, oferindu-i un număr mare de exemple Intenția mea inițială a fost să includ în carte un capitol care să se ocupe de metodele de luare a deciziilor folosind mașini de învățare Totuși, am ajuns la concluzia că acest subiect nu a fost încă dezvoltat până la punctul în care să poată fi inclus într-un manual Nivelul la care este prezentat materialul din această carte face posibilă utilizarea acestuia ca suport didactic pentru studenții de licență și absolvenți Un curs preliminar de prelegeri despre logica matematică ar fi util, dar deloc necesar pentru lectura ei Cititorul care este familiarizat cu conceptele de bază ale teoriei mulțimilor și ale matematicii combinatorii nu ar trebui să întâmpine dificultăți în a analiza demonstrațiile date în carte La sfârșitul fiecărui capitol sunt date sarcini care pot fi împărțite în trei grupe Unele dintre ele sunt pur și simplu menite să testeze înțelegerea de către cititor a materialului cărții, altele conțin idei importante care nu sunt pe deplin explicate în text, iar altele ar putea servi drept subiecte pentru lucrările corespunzătoare Ultimul grup de sarcini este marcat cu un asterisc Fiecare capitol conține, de asemenea, "Note bibliografice și istorice", care listează și pe scurt despre cuvânt înainte se judecă cele mai importante lucrări pe materialul capitolului corespunzător Toate aceste lucrări sunt grupate în ordine alfabetică în bibliografia de la sfârșitul cărții O serie de organizații și persoane au oferit asistență neprețuită în realizarea acestei cărți Aș dori să subliniez sprijinul inițial al Diviziei de Sisteme Informaționale a Oficiului de Cercetare Navală Ajutor suplimentar a venit de la Information Processing Engineering Group al Advanced Research Projects Agency, care sprijină lucrările pe proiecte de inteligență artificială la Institutul de Cercetare Stanford și la Universitatea Stanford (unde am petrecut o parte a anului universitar în - ) Grupul de inteligență artificială de la Institutul de Cercetare Stanford, al cărui membru sunt, a creat toate condițiile necesare pentru această lucrare Dr Peter Hart de la Institutul de Cercetare Stanford a depus un efort considerabil citind și criticând mai multe schițe ale manuscrisului Cu ajutorul lui s-a făcut mult mai clară prezentarea materialului Interviurile cu profesorii de informatică de la Universitatea Stanford Edward Feigenbaum și Arthur Samuel m-au ajutat să decid asupra structurii cărții De asemenea, vreau să-i mulțumesc profesorului David Luckham de la Stanford pentru încercarea sa de a mă învăța logica matematică (formală) Mulți dintre studenții absolvenți de calcul ai Stanford, precum J Kenneth Seabers, au făcut sugestii pentru a îmbunătăți această carte Nils Nilsson LA EDIȚIA RUSĂ Această prefață, scrisă special pentru ediția rusă, îmi oferă ocazia să fac o serie de noi considerații despre inteligența artificială în general și despre această carte în special În primul rând, aș dori să mă opresc asupra poziției mele cu privire la importanța proceselor de căutare și a diverselor strategii de rezolvare a problemelor studiate în această carte Recent, cercetarea inteligenței artificiale din Statele Unite s-a îndepărtat într-o oarecare măsură de căutarea euristică Primul motiv pentru aceasta pare să fie că tehnica de căutare euristică a fost deja adusă la un asemenea nivel de dezvoltare încât studierea ulterioară a tehnicilor de căutare cu greu poate crește radical eficiența acestora Un alt motiv, și mai important, este că experiența a arătat că procesele de căutare generalizate, luate de la sine, nu sunt în general suficiente pentru o soluție reală cuvânt înainte sarcini complexe Dacă trebuie să scrieți programe pentru un computer care vă permit să traduceți dintr-o limbă în alta, să jucați șah cu măiestrie, control eficient și inteligent activitățile unui robot mecanic, atunci în astfel de programe trebuie să investiți, pe lângă informații specifice ( despre limbă, despre șah etc ) ), precum și idei de "bun simț" despre lumea din jurul nostru Prin urmare, cercetarea inteligenței artificiale în mai multe centre majore din SUA se concentrează în prezent asupra modului de reprezentare a acestor cunoștințe în sistemele de programe informatice și a modului de utilizare a acestora După ce a remarcat această schimbare a accentului, potențialul nostru cititor s-ar putea gândi că poate ar trebui să citească și alte cărți, cum ar fi Cum să puneți cunoștințele în programele computerului sau, mai bine, Cum computerele pot asimila cunoștințele Nu putem decât să ne dorim ca astfel de cărți să existe Din păcate, ele nu există încă (Poate că unii dintre cititorii acestei prefețe vor fi implicați în redactarea lor ) În orice caz, scopul acestei cărți nu este de a explica problemele cele mai la modă din domeniul inteligenței artificiale în prezent, ci mai degrabă de a introduce cititor la cercul de idei, care sunt atât semnificative, cât și destul de stabile După cum s-a menționat în prefața ediției americane, cred că inteligența artificială este în esență o disciplină de inginerie Vrem să construim sisteme inteligente Ca și în cazul oricărei discipline de inginerie, există mai multe subiecte teoretice asociate acesteia, a căror cunoaștere este obligatorie pentru un specialist Încă cred că căutarea euristică discutată în această carte reprezintă o componentă majoră a tehnicilor de inteligență artificială Ar fi foarte greu de înțeles calea actuală de dezvoltare a inteligenței artificiale fără a avea cunoștințe de bază despre subiectele discutate în carte Aceste articole nu au devenit brusc inutile Dimpotrivă: acum se presupune că specialistul le cunoaște deja bine Este clar că există și alte întrebări fundamentale în domeniul inteligenței artificiale La cele spuse despre aceasta în prefața ediției americane, aș adăuga aici că viitorul specialist poate fi sfătuit să dobândească cunoștințe în domenii precum sistemele automate de control și sistemele informaționale Cu aceste fundamente, cercetătorul gânditor va fi bine poziționat pentru a dezvolta noi idei importante în domeniul inteligenței artificiale martie Niils Iilson Palo Alto Capitolul INTRODUCERE SOLUȚIONAREA PROBLEMELOR ȘI INTELIGENTĂ ARTIFICIALĂ Multe activități umane, cum ar fi rezolvarea puzzle-urilor, participarea la jocuri, efectuarea de matematică și chiar conducerea unei mașini, necesită, așa cum se crede în mod obișnuit, participarea "inteligenței" Dacă computerele ar putea gestiona acest tip de activitate, atunci ei (împreună cu programele lor) ar avea probabil un anumit grad de inteligență artificială Mulți experți cred că în cele din urmă inteligența artificială a computerelor va depăși inteligența umană, deși acum se recunoaște din ce în ce mai mult faptul că procesele necesare pentru a îndeplini chiar și cele mai comune sarcini umane vor fi inevitabil extrem de complexe În această carte, vom examina în detaliu câteva dintre procesele asociate cu rezolvarea problemelor în care este implicată inteligența Rezolvarea problemelor poate părea un subiect foarte obscur, "și totuși este în centrul multor cercetări în domeniul inteligenței artificiale În sensul cel mai larg al acestor cuvinte, găsirea de soluții include întreaga știință computațională, deoarece orice problemă de calcul poate fi considerată ca o problemă a cărei soluție trebuie găsită Cu toate acestea, pentru scopurile noastre, este necesară o definiție mai restrânsă care să excludă metodele de calcul standard, cum ar fi cele utilizate, de exemplu, în inversarea unei matrice de ordinul sau în rezolvarea unui sistem de ecuații diferențiale liniare Dacă aruncăm o privire mai atentă asupra metodelor de găsire a soluțiilor studiate în cercetarea inteligenței artificiale, constatăm că majoritatea folosesc conceptul de căutare prin încercare și eroare Aceasta înseamnă că în aceste metode, problemele sunt rezolvate prin căutarea unei soluții în spațiul soluțiilor posibile Scopul nostru este de a explica cele mai importante metode de rezolvare a problemelor folosind procedurile de căutare Există, desigur, și alte domenii importante în studiul inteligenței artificiale Reprezentanții tipici ai celor care au primit o atenție specială (altele decât găsirea de soluții) sunt următorii: ' Ch Introducere Prelucrarea datelor senzoriale (în special imagini vizuale și vorbire) Sisteme complexe de stocare și recuperare a informațiilor Prelucrarea limbilor naturale Din păcate, nimeni nu a reușit încă să spună ceva suficient de util despre modul în care elementele numite ar putea fi combinate într-o "inteligență" comună (oricare ar fi) De fapt, la o analiză atentă, devine clar că oricare dintre presupusele componente "fundamentale" ale comportamentului intelectual conține, aparent, trăsăturile altor componente fundamentale Deci, pentru percepția senzorială, pot fi necesare metode foarte sofisticate de alegere a unei soluții, pentru care, la rândul său, este nevoie de un sistem destul de eficient de extragere a informațiilor, eventual bazat pe o alegere suplimentară de soluții etc Experiența noastră cu aceste procese complexe este încă insuficientă pentru a crea o teorie unificată a organizării inteligenței De fapt, în prezent nu există niciun motiv să credem că o astfel de teorie ar putea exista deloc Unii cercetători consideră că comportamentul inteligent poate fi obținut pe computere doar prin combinarea unor programe specializate, fiecare dintre acestea conținând un set de soluții potrivite pentru un caz dat (sau, așa cum sunt adesea numite, "descoperiri de programare"), cu capacitatea de a accesa un depozit de informaţii enciclopedice conţinând fapte bine organizate Cu toate acestea, acum nu am dori să luăm o poziție certă cu privire la această problemă În schimb, vom descrie acele tehnici de rezolvare a problemelor care par să aibă o gamă destul de largă de aplicații PUZZLE ȘI JOCURI CA EXEMPLE DE PROVOCĂRI Nu am dat încă o definiție precisă a ceea ce înseamnă rezolvarea unei anumite probleme folosind metode de căutare În mod similar, nu am definit ce înțelegem prin sarcină Aparent, nimeni nu a dat încă o definiție atât de simplă a cuvântului "sarcină" care să corespundă pe deplin sensului intuitiv pe care intenționăm să-l folosim aici Prin urmare, în loc să încercăm să dăm o definiție formală, vom începe discuția prin a privi un exemplu tipic de problemă Puzzle-urile și jocurile oferă o sursă inepuizabilă de exemple utile pentru ilustrarea și testarea metodelor Puzzle-uri și jocuri ca exemple de sarcini dov rezolvarea problemelor Pentru computere au fost scrise programe pentru rezolvarea multor tipuri de puzzle-uri destul de dificile pentru o persoană Au fost scrise și alte programe care au învins jucătorii experimentați de jocuri de societate, cum ar fi șah și dame După cum spune Minsky ( , p ): "Jocurile și problemele matematice sunt luate nu pentru că sunt simple și clare, ci pentru că ne oferă cea mai mare complexitate cu structuri inițiale minime, astfel încât să putem aborda niște situații cu adevărat dificile, relativ puțin distras de problemele de programare În sarcinile de joc și soluțiile de puzzle, multe idei au apărut și s-au șlefuit, care s-au dovedit a fi cu adevărat Orez Joc la cincisprezece (stânga - configurația inițială, dreapta - țintă) Pentru a ilustra conceptele care apar în rezolvarea problemelor, vom folosi adesea puzzle-ul cunoscut sub numele de jocul celor cincisprezece Folosește cincisprezece piese mobile numerotate situate pe un pătrat de X O celulă a acestui site rămâne mereu goală, astfel încât unul dintre cipurile adiacente acestuia poate fi întotdeauna mutat în locul acestei celule goale, "mutând" astfel această celulă goală Jocul celor cincisprezece este ilustrat în fig , care arată două configurații de cipuri Luați în considerare problema transferului unei configurații inițiale la o configurație țintă dată Soluția la această problemă este o secvență adecvată de mișcări, cum ar fi "mutați la stânga, în jos etc " Jocul celor cincisprezece este un exemplu minunat al unei clase de probleme pentru care metodele prezentate în această carte sunt cele mai potrivite Această problemă are o situație inițială bine definită și un scop bine definit Există, de asemenea, un set de operațiuni, sau mișcări, care transformă o situație în alta Începem prin a introduce câteva concepte fundamentale legate de găsirea de soluții care pot fi folosite pentru a rezolva jocul celor cincisprezece Ch Introducere STATE și OPERATORI Aparent, cea mai simplă abordare pentru a găsi o soluție pentru un joc de cincisprezece este să încercați diferite mișcări până când configurația țintă este atinsă Acest tip de încercare este în esență o căutare prin încercare și eroare (Desigur, presupunem că o astfel de căutare poate fi efectuată în principiu, să zicem, pe un computer, și nu cu implicarea unui joc real de cincisprezece) Pornind de la configurația inițială, am putea construi toate configurațiile rezultate din execuția fiecăreia dintre mișcările posibile, apoi construim următorul set de configurații după aplicarea următoarei mișcări și așa mai departe până când se ajunge la configurația țintă Pentru a discuta despre acest tip de metode de căutare a soluțiilor, se dovedește a fi utilă introducerea conceptelor de stări și operatori pentru o anumită problemă Pentru un joc de cincisprezece, starea problemei este pur și simplu un anumit aranjament de jetoane Configurațiile inițiale și țintă reprezintă stările inițiale și, respectiv, țintă Spațiul stărilor accesibile din starea inițială este format din toate acele configurații de jetoane care se pot forma ca urmare a mișcării jetoanelor admisibile prin reguli Multe dintre problemele pe care le vom întâlni au spații de stare extrem de mari (dacă nu infinite) ) Un operator transformă o stare în alta Jocul celor cincisprezece este interpretat cel mai firesc ca un joc care are patru operatori, corespunzători următoarelor mișcări: mutați o celulă goală (spațiu) la stânga, în sus, la dreapta și în jos În unele cazuri, operatorul poate să nu fie aplicabil unei anumite stări: de exemplu, operatorul "deplasare la dreapta" nu poate fi aplicat stării țintă din Fig În limbajul nostru de stări și operatori, soluția unei probleme este o succesiune de operatori care transformă starea inițială în starea țintă Este util să ne gândim la spațiul stărilor accesibile dintr-o stare inițială dată ca un graf ale cărui vârfuri corespund acestor stări Vârfurile unui astfel de grafic sunt interconectate prin arce corespunzătoare operatorilor Pe fig arată o mică parte a graficului pentru jocul de cincisprezece Pe acest grafic, fiecare vârf conține configurația de jetoane pe care o reprezintă ) Sunt în jocul celor cincisprezece! diverse configurații de cipuri și o cușcă goală Un Pologin dintre ele (sau aproximativ , -IO ) este realizabil din această configurație inițială State și Operatori Soluția jocului de cincisprezece s-ar putea obține folosind un proces de căutare (enumerare) în care, în primul rând, operatori sunt aplicați la starea inițială pentru a obține noi stări - cărora li se aplică și operatori etc , până la o stare corespunzătoare scopului se va construi Cel mai convenabil este să explicați metodele de organizare a unei astfel de căutări pentru starea țintă folosind reprezentarea sub forma unui grafic din Fig Despre metoda de rezolvare a problemelor bazată pe conceptele de stări și operatori, s-ar putea spune că aceasta este o abordare a problemei din punct de vedere al spațiului stărilor În general, vom asocia acest din urmă termen cu metode în care secvențele de test ale instrucțiunilor sunt construite incremental, pornind de la o instrucțiune inițială și apoi adăugând câte o instrucțiune de fiecare dată până când se ajunge la starea țintă Vom reveni la o discuție suplimentară despre metodele spațiului de stare în următoarele două capitole ') În literatura internă, cuvântul "forță brută" este utilizat pe scară largă ca semnificație a "căutare" în engleză ("căutare") Mai jos vom folosi ambii termeni rusi ca echivalent - Notă, trad Ch Introducere REDUCEREA UNEI SARCINI LA SUBSARCINI Într-un fel, o abordare mai subtilă a rezolvării unei probleme este asociată cu conceptul de subsarcini Cu această abordare, studiul problemei inițiale este efectuat pentru a selecta un astfel de set de subsarcini încât soluția unui subset specific al acestor subsarcini să conțină soluția problemei inițiale Luați în considerare, de exemplu, problema conducerii unei mașini de la Palo Alto (California) la Cambridge (Massachusetts) Această sarcină poate fi redusă, să zicem, la următoarele subsarcini: Sarcina secundară Conduceți de la Palo Alto la San Francisco Sarcina secundară Conduceți de la San Francisco la Chicago, computer Illinois Sarcina secundară Conduceți de la Chicago la Albany, computer NY Sarcina secundară Călătoriți de la Albany la Cambridge Aici, soluția tuturor celor patru subprobleme ar oferi o soluție la problema inițială Fiecare dintre sarcinile secundare poate fi rezolvată folosind orice metodă Li se pot aplica metode din spațiul de stat sau pot fi analizate pentru a-și identifica propriile subsarcini pentru fiecare etc Dacă continuăm procesul de împărțire a subsarcinilor emergente în altele și mai mici, atunci în cele din urmă vom ajunge la unele probleme elementare, a căror rezolvare poate fi considerată banală Despre orice metodă de rezolvare a unei probleme prin dezvoltarea și apoi rezolvarea de subsarcini, vom spune că folosește o abordare bazată pe reducerea problemei Rețineți că, strict vorbind, abordarea spațiului de stare poate fi privită ca un caz degenerat al abordării de reducere a problemei, deoarece fiecare aplicație a operatorului reduce problema la o subproblemă oarecum mai simplă Adevărat, de regulă, ne vom ocupa de cazuri în care subproblemele care decurg din reducere sunt obținute într-un mod nu atât de banal Este important de reținut că căutarea prin încercare și eroare joacă încă un rol important în abordarea reducerii problemelor În fiecare dintre etape, pot apărea mai multe seturi alternative de subsarcini, la care această sarcină poate fi redusă Întrucât unele dintre aceste seturi, în cele din urmă, pot să nu conducă la soluția finală a problemei, atunci, de regulă, o căutare în spațiul de seturi de subsarcini este necesară pentru a rezolva problema inițială În capitolele și , vom reveni la o discuție despre metodele bazate pe reducerea sarcinilor Utilizarea logicii formale în rezolvarea problemelor *D UTILIZAREA LOGICII FORMALE ÎN REZOLVAREA PROBLEMELOR Adesea, pentru a rezolva o problemă, fie este necesară o anumită cantitate de analiză logică, fie căutarea unei soluții este mult facilitată după o astfel de analiză Uneori, o astfel de analiză arată că anumite probleme sunt de nerezolvat Într-un joc de cincisprezece, de exemplu, se poate demonstra ) că configurația țintă / și ІЗ ■ în abordări bazate pe utilizarea spațiului de stat, și în abordări legate de reducerea problemelor În abordările de primul tip, deducerea poate necesita testul prin care se determină dacă o anumită stare va fi o stare care îndeplinește scopul În plus, poate fi necesar un raționament logic pentru a determina care dintre operatori este aplicabil unei anumite stări ') Această afirmație decurge din analiza logică a acestui joc, care arată că mulțimea configurațiilor posibile poate fi împărțită în două submulțimi A și B care nu se intersectează, și niciun element al submulțimii A nu poate fi transformat într-un element al submulțimii B și viceversa, Ch Introducere niyu După cum am văzut deja, uneori este posibil să se demonstreze că o anumită problemă este de nerezolvat În abordările bazate pe reducerea problemelor, o dovadă de acest fel ar face posibilă evitarea încercărilor zadarnice de a rezolva subprobleme de nerezolvat Pe lângă astfel de aplicații, dorim și să putem rezolva probleme care sunt probleme de probă De exemplu, poate dorim să găsim o demonstrație a unei teoreme matematice scrise într-un anumit sistem formal, cum ar fi calculul predicat de ordinul întâi Astfel, un studiu complet al tehnicilor de rezolvare a problemelor trebuie să includă luarea în considerare a metodelor mașinii pentru găsirea dovezilor Unele dintre aceste metode se bazează pe strategii de căutare precum cele pe care le vom discuta în legătură cu abordările de reducere a spațiului de stare și a sarcinilor Deși există multe modalități de a alege un anumit formalism logic, vom lua în considerare tehnica recent dezvoltată pentru demonstrarea teoremelor în calculul predicatelor de ordinul întâi, bazată pe principiul rezoluțiilor, și aplicarea unei astfel de tehnici la rezolvarea problemelor Acesta va fi subiectul cap - In discutarea demonstrarii automate a teoremelor vom arata ca si problemele nematematice pot fi formulate ca teoreme de demonstrat formulate in principiu in cadrul unui anumit formalism logic si apoi rezolvate prin metoda demonstrarii teoremelor Utilizarea logicii formale și a metodelor de demonstrare a teoremelor ne permite să ne gândim la un rezolvator de probleme cu adevărat "universal" Informații noi ar putea fi introduse într-un astfel de rezolvator de probleme pur și simplu sub forma adăugării de noi axiome suplimentare în memoria sa și nu prin reelaborarea programului său El ar putea rezolva probleme din zone destul de largi, deoarece există formalisme logice care sunt suficient de universale pentru a exprima orice informație și a nota orice problemă DOUĂ ELEMENTE COMPONENTE ALE PROCESULUI DE REZOLVARE A PROBLEMELOR: REPREZENTAREA ȘI CĂUTAREA (enumerarea) În fiecare dintre abordările de rezolvare a problemelor despre care am vorbit, este necesară o căutare de un anumit tip pentru a construi o soluție Această carte este scrisă în primul rând despre cum să desfășurăm o astfel de căutare cât mai eficient posibil Dar înainte ca un astfel de proces de căutare să poată fi pornit Note bibliografice și istorice chat, problema în sine trebuie enunțată fie în cadrul abordării spațiului de stare sau al reducerii la subprobleme, fie ca o teoremă care trebuie demonstrată De obicei, atunci când o persoană rezolvă o problemă, admirăm nu o căutare rapidă și ordonată în spațiu a tuturor soluțiilor posibile, ci capacitatea de a găsi un punct de vedere atât de clar asupra problemei luate în considerare, care face soluția elegant și simplă În capitolul următor, vom discuta problema stabilirii și prezentării problemei într-o asemenea formă încât să poată fi rezolvată printr-o metodă bazată pe luarea în considerare a spațiului de stare Vom vedea că există mai multe reprezentări pentru aceeași problemă, unele reprezentări producând spații de stare mult mai înguste decât altele Deoarece chiar și cele mai eficiente metode de căutare vor fi inutile dacă spațiul de căutare este prea mare, este important să poți reprezenta problema în cel mai economic mod posibil Problema alegerii unei reprezentări este comună oricărei metode de rezolvare a problemelor, dar, din păcate, cercetarea inteligenței artificiale nu a dezvoltat încă o metodă automată universală pentru găsirea unor formulări inteligente ale problemelor Prin urmare, în ciuda faptului că există două aspecte ale rezolvării automate a problemelor, și anume reprezentarea și căutarea, în această carte suntem forțați să ne limităm la luarea în considerare în principal a problemelor de căutare NOTE BIBLIOGRAFICE SI ISTORICE "Intelectul" computerelor Întrebarea dacă mașinile pot "gândi" (sau vor putea vreodată) este încă o discuție vie chiar și printre cei care admit că omul însuși este un fel de mașină Turing (L ) a eliminat multe dintre argumentele standard împotriva mașinilor de gândire Pentru a rezolva întrebarea dacă o mașină poate gândi, ei au propus un test, care acum se numește în mod obișnuit testul Turing, Selfridge și Kelly ( ) au discutat amploarea dificultăților practice implicate în construirea mașinilor inteligente după ce au ajuns la concluzia că nu există interdicții teoretice cunoscute Hubert Dreyfus ( ) a afirmat că computerele digitale sunt fundamental incapabile să efectueze astfel de acțiuni indispensabile pentru inteligență precum "conștientizarea marginii" și "gruparea clară" Argumentul său a fost respins constant de Papert ( )t Ch Introducere Inteligența artificială în general Încercările de eficientizare a domeniului inteligenței artificiale nu au avut niciodată succes în totalitate Într-un articol important de recenzie, Minsky ( a) a propus următoarea listă: căutare, recunoaștere a modelelor, învățare, rezolvare de probleme, inferență O astfel de schemă este încă utilă, deși meritele sale clasificatorii sunt mult reduse de abundența din literatura de specialitate a afirmațiilor de forma: "problema X este în esență o problemă Y", unde X și Y pot fi orice pereche de componente despre care a vorbit Minsky Nu cu mult timp în urmă, Minsky ( ) a scris un alt articol informativ despre fundamentele inteligenței artificiale, care concluzionează că principala problemă este formarea, menținerea și extragerea informațiilor dintr-un set mare de ele Diferite abordări în domeniul inteligenței artificiale Când încercăm să construim mașini inteligente, ne punem în mod firesc întrebarea care este secretul inteligenței naturale Căutarea unui răspuns la această întrebare a fost asociată cu o serie de evenimente remarcabile, dar până acum nimeni nu a reușit să rezolve acest mister Rosenblatt ( ) a propus modele cerebrale numite perceptroni Acestea erau rețele de neuroni artificiali bazate pe modele neuronale McCulloch-Pitts ( ) Studiul perceptronilor a fost inițial stimulat de cercetătorii în recunoașterea modelelor și a condus la unele rezultate matematice elegante în geometria computațională (Minskii și Peitsert, ) Cu toate acestea, procesele complexe asociate cu inteligența s-au dovedit a fi dincolo de limitele posibilităților inerente acestor modele simple de perceptron O altă abordare bazată pe concepte biologice a fost o încercare foarte grandioasă de a modela evoluția însăși Întrucât procesul evolutiv a durat două miliarde de ani pentru a crea o persoană inteligentă, de ce să nu folosim un computer și să simulăm un astfel de proces evolutiv cu viteză mare? Vogel et al ( ) descriu experimente în care procesul de construire a multor generații de mașini cu un număr finit de stări a fost modelat folosind ideile de mutație și supraviețuire selectivă Deși această abordare face posibilă reducerea primelor câteva milioane de ani de evoluție la câteva zile de timp de calcul, se pare că etapele importante medii și târzii ale evoluției sunt asociate cu structuri atât de complexe (deși nu sunt încă "inteligente") încât evoluţia nu mai poate fi accelerată prin simulare pe calculator Note bibliografice și istorice mașină Prin urmare, o astfel de "evoluție artificială" nu a dus la crearea unor mașini cu adevărat complexe O altă modalitate de a înțelege inteligența naturală a animalelor este studierea comportamentului lor, și în special a comportamentului uman, atunci când rezolvăm probleme Travis I ( , ) discută rolul introspecției în proiectarea soluției de probleme Newell, Shaw și Simon ( ) au descris un "rezolvator universal de probleme" care tratează o problemă în aproape același mod ca un om O sursă bogată de idei despre modul în care oamenii abordează rezolvarea problemelor este Polya ( ) Privind metodele de rezolvare a problemelor bazate pe analiza comportamentului uman, constatăm că căutarea prin încercare și eroare la un anumit nivel joacă un rol cheie în ele Campbell ( ) numește procesul de căutare nedirecționată procesul de "schimbare oarbă și supraviețuire selectivă" El conchide: Procesul de schimbare oarbă și de supraviețuire selectivă stă la baza construcțiilor inductive de succes, la baza tuturor cazurilor în care corpul de cunoștințe crește efectiv, a tuturor cazurilor de îmbunătățire a adaptării unui sistem la mediul său Procesele care întrerup întregul proces de schimbare oarbă și de supraviețuire selectivă sunt ele însele rezultatul unor construcții inductive de succes care conțin informații utile despre mediu, obținute inițial ca urmare a unui proces de schimbare oarbă și supraviețuire selectivă Mai mult, aceste procese substitutive în sine se bazează la un anumit nivel pe procesul de schimbare oarbă și de supraviețuire selectivă în funcționarea lor Suntem de acord cu Campbell asupra rolului primordial al căutării Într-adevăr, tehnica esențială în construirea unui rezolvator automat de probleme este de a căuta la cel mai înalt nivel permis de informațiile disponibile despre problema în sine și cum ar putea fi rezolvată Astfel, în această carte, ne interesează în primul rând metodele de căutare și cum să le eficientizăm folosind toate informațiile disponibile Metode de căutare a soluției Există doar câteva încercări în literatura de specialitate de a studia procesele de rezolvare a problemelor într-un mod abstract pentru a eficientiza diferitele metode și a deriva proprietățile lor generale Ch Introducere În această carte, încercăm să evidențiem câteva dintre conceptele cheie implicate în găsirea de soluții și să le prezentăm în mod coerent Un mod ușor diferit de sistematizare a discuției despre metodele de găsire a soluțiilor este propus de Newell ( ) O serie de articole dificile, dar foarte valoroase ale lui Amarel ( , , ) au influențat puternic construcția acestei cărți O formalizare a unora dintre ideile de soluții cu care ne ocupăm în cartea noastră este dată într-un articol de Sanduall ( ) Un studiu foarte formal despre rezolvarea problemelor și jocul poate fi găsit în Benerji ( ) Abordarea rezolvării problemelor folosind spațiul de stare a primit această denumire prin analogie cu situația din teoria controlului, unde spațiile de stare sunt, de asemenea, folosite în scopuri similare Acestea din urmă sunt utilizate pe scară largă în teoria cercetării operaționale Unele dintre metodele de căutare în spațiul de stare pe care le vom discuta mai târziu sunt identice cu metodele care se numesc metode ramificate și legate în teoria cercetării operaționale Pentru o privire de ansamblu asupra metodelor ramificate și legate și a aplicațiilor lor, a se vedea Lawler și Wood ( ) Dorința noastră de a distinge metodele folosind conceptul de spațiu de stare și metodele bazate pe reducerea sarcinilor se datorează faptului că aceste metode folosesc strategii de căutare diferite Această distincție este de aceeași natură cu cea remarcată de Amarel ( ) între metodele "de tip producție" și "de tip reducere" Slagel ( a), în descrierea programului său de integrare simbolică, a găsit de asemenea utilă folosirea noțiunii de reducere a unei probleme la subprobleme În opinia noastră, lucrarea General Problem Solver de Newell și asociații săi (Ernst și Newell, ) este mult mai ușor de înțeles dacă este descrisă ca un rezolvator de probleme bazat pe reducerea unei probleme la subprobleme Utilizarea metodelor formale pentru a deduce inferențe logice în rezolvarea problemelor poate fi găsită în notele lui McCarthy ( , ) despre un sistem de "bacșiș" Acest sistem trebuia să obțină soluții pentru probleme dintr-un număr mare de axiome reprezentând cunoștințele pe care le are solutorul Este foarte ușor pentru un astfel de sistem să dea "sfaturi" prin simpla adăugare de noi axiome Lucrarea lui Black ( ) a fost una dintre primele lucrări bazate pe această idee O Unele dintre cele mai recente lucrări în acest domeniu vor fi discutate în Cap Lin Sheng ( , ) a exprimat o serie de idei geniale despre rezolvarea unor mari probleme combinatorii El a oferit mai multe strategii eficiente pentru a împărți o sarcină în subsarcini Note bibliografice si istorice H-) și terminale vârfurile reprezintă simbolurile variabile sau constante (A, B, C, D) care apar în această expresie În acest fel Operatori zom, arborele de reprezentare pentru expresia (AB + CD)/BC ar trebui să fie Aici, ramura care se extinde de la vârful - la stânga reprezintă numărătorul fracției, iar ramura care se extinde spre dreapta este numitorul acesteia Aplicarea legilor transformărilor algebrice (operatori în spațiul stărilor) ar duce la transformarea acestei descrieri în alte descrieri Sarcina noastră este să o transformăm într-o stare "descrisă de copac O altă formă binecunoscută de descriere este șirul liniar O posibilă descriere pentru expresia (AB CD)/BC ca șir este - + X AB X CD X BC Aici, operatorii aritmetici ( -, + și X) sunt numiți operatori de prefix deoarece preced operanzii lor pe această linie Deoarece știm că fiecare dintre acești operatori se aplică exact la doi operanzi, nu este nevoie de punctuație pe această linie Operanzii pentru simbolul -f- din acest șir, de exemplu, ar trebui să fie două subșiruri imediat consecutive, care sunt expresiile algebrice XAB și XCD Folosind descrierea sub formă de șir, putem formula problema în fața noastră ca problema conversiei șirului - -f- X AB XX CD X BC în șirul + -AC - DB OPERATORI Operatorii transferă o stare în alta Astfel, ele pot fi considerate ca funcții definite pe un set de stări și luând valori din acest set Cap Reprezentarea sarcinilor în spațiul statelor gesturi ) Deoarece procesele noastre de rezolvare a problemelor se bazează pe lucrul cu descrieri de stare, vom presupune că operatorii sunt funcții ale acestor descrieri, iar valorile lor sunt descrieri noi Am putea, desigur, să ne definim funcțiile operatorului cu un tabel care asociază cu fiecare descriere a stării "intrare" o descriere a "ieșirii" Pentru probleme mari, un astfel de tabel ar fi practic inutilizabil, așa că în cazul general vom presupune că operatorii sunt calcule care transformă o descriere a stării în alta ' Pentru descrierile de stare sub formă de șir, există o modalitate foarte convenabilă de a reprezenta calculele operatorilor Se bazează pe ideea de scriere a regulilor (uneori numite producții) Un set de reguli de rescriere definește modalitățile posibile de a converti un șir în altul Toate regulile de rescriere sunt de forma S"-*S , ceea ce înseamnă că șirul Si poate fi convertit în șirul Sj Un exemplu de regulă de rescriere este: Înseamnă că dacă caracterul A apare ca primul caracter al unui șir, atunci acesta poate fi înlocuit cu caracterul B Semnul $ este un subșir arbitrar (inclusiv șirul gol) În regula de rescriere de mai sus, semnul $ indică faptul că partea din șir (oricare ar fi aceasta) care urmează imediat lui A nu este schimbată atunci când A este înlocuit cu B Semne multiple $ pot fi folosite pentru a specifica mai multe subșiruri diferite în regulile de rescriere Aceasta ne oferă următoarele exemple de posibile reguli de rescriere: A$A->D (șir de început și sfârșit simbolul A, poate fi înlocuit cu un singur simbol L) (un singur caracter A, situat între două caractere B, poate fi exclus) $i$ $z -* $i$ $r$z (fiecare subșir poate fi torena) $і$ $ $z -* $і$r$z (unul din doi care stau lângă unul- subșirurile de șir pot fi excluse) ') De fapt, ele pot să nu fie definite pe întregul set de stări, deoarece operatorul poate să nu fie aplicabil unor state Operatori Folosind, de exemplu, ultimele două reguli, șirul ABCHABC poate fi convertit în șirul ABC după cum urmează: ■ ABCWABC -* AB ABCWABC -> AB ABC -> ABC O regulă de rescriere poate fi adesea aplicată unui șir dat în mai multe moduri diferite Deci, în X, Xg X x xs Xe x x xt x x xb x x x * Xt * * x x * * X x, * x x x * heh * Orez Rescrierea regulilor pentru jocul de opt În acest exemplu, regula nu poate fi aplicată deloc șirului ABCHABC, în timp ce regula poate fi aplicată acestuia în mai multe moduri Desigur, există o aplicare specifică a unei anumite reguli de rescriere pentru un anumit operator Din moment ce o regulă de rescriere poate treizeci Ch Reprezentarea sarcinilor în spațiul de stat pune mulți operatori diferiți, atunci regulile de rescriere sunt utilizate pe scară largă în rezolvarea problemelor Reprezentarea declarațiilor cu reguli de rescriere nu trebuie neapărat limitată la situațiile în care stările sunt descrise prin șiruri Idei similare pot fi folosite, de exemplu, în jocul celor cincisprezece, în care descrierea naturală a stărilor este o matrice X Să ilustrăm acest concept generalizat de rescriere a regulilor cu exemplul jocului de opt, o versiune simplificată a jocului de cincisprezece În acest joc, opt piese numerotate sunt plasate pe o tablă X O modalitate de a reprezenta mișcările legale în acest joc este de a avea un set de reguli de rescriere definite peste matrice Aceste reguli definesc modalitățile în care matricele X pot fi convertite în alte matrice de aceeași dimensiune Pe fig Figura prezintă un set de reguli de rescriere pentru un joc de opt Fiecare regulă este de fapt două reguli (după cum este indicat de săgețile cu două capete) îmbinate într-una singură pentru a economisi spațiu; în fiecare caz intrarea din stânga poate fi înlocuită cu cea din dreapta și invers În fiecare dintre regulile de rescriere, mutarea permisă este determinată prin înlocuirea numerelor , , , în locul variabilelor Xi, X , , Xi pe fiecare parte a săgeții (cu condiția ca Xi =#= Xi) Asa de, ■ poate fi convertit în ■ prin aplicarea regulii STARE DE GOOL Toate procedurile noastre de explorare a spațiului statal includ construirea de noi descrieri de stat, pornind de la cele vechi, urmate de verificarea noilor descrieri de stat, Intrarea graficului pentru a se asigura că nu descriu o stare care îndeplinește scopul Adesea, acesta este pur și simplu un test pentru a vedea dacă o anumită descriere a stării se potrivește cu o anumită descriere a stării țintă, dar uneori trebuie făcută o verificare mai complexă De exemplu, pentru un joc de cincisprezece, scopul ar putea fi acela de a crea o configurație de jetoane în care în primele două rânduri de sus nu există jetoane cu numere mai mari de În orice caz, proprietatea pe care trebuie să o îndeplinească descrierea stării pentru ca această stare să fie scopul trebuie să fie pe deplin caracterizat În unele probleme de optimizare, nu este suficient să găsiți vreo cale care să conducă la obiectiv, dar este necesar să găsiți o cale care să optimizeze un anumit criteriu (de exemplu, minimizarea numărului de aplicații ale operatorilor) Cel mai ușor este să lucrați cu astfel de probleme, asigurându-vă că căutarea nu se încheie până când nu este găsită o soluție optimă Metodele de căutare în spațiul de stare discutate în capitolul următor oferă o soluție optimă Astfel, vedem că pentru o reprezentare completă a problemei în spațiul stărilor este necesar să se precizeze: a) forma descrierii stărilor și, în special, descrierea stării inițiale, b) setul de operatori și efectele acestora asupra descrierilor stărilor, c) proprietățile descrierii stării țintă Am observat deja că este util să ne gândim la spațiul stărilor ca la un graf direcționat O astfel de reprezentare este utilă în special pentru explorarea diferitelor metode de căutare în spațiul de stare În secțiunea următoare, vom oferi câteva informații necesare din teoria grafurilor ÎNREGISTRARE CA GRAF În cap , am folosit un grafic pentru a ilustra spațiul de stare pentru jocul de cincisprezece Până acum, discuția noastră despre grafice a fost intuitivă, dar această secțiune va introduce câteva concepte formale utile legate de grafice " Un grafic este format dintr-o mulțime (nu neapărat finită) de vârfuri Unele perechi de vârfuri sunt conectate prin arce, iar aceste arce sunt direcționate de la un membru al acestei perechi la altul Astfel de grafice se numesc grafice direcționate Dacă un arc este îndreptat de la vârful Pi către vârful nj, atunci se spune că vârful rij este vârful copil al vârfului n, iar vârful n este vârful părinte al vârfului Se poate dovedi că două vârfuri vor fi fiți copii unii altora; în acest caz, o pereche de arce direcționate este uneori numită o muchie a graficului În cazul în care graficul este folosit pentru Ch Reprezentarea sarcinilor în spațiul de stat stabilirea spațiului de stări, descrierile stărilor sunt asociate cu vârfurile sale și operatorii sunt asociați cu arcele sale Secvența de vârfuri pc, pc, , în care fiecare vârf este un copil al lui /r,, > i, j = , , k, se numește o cale de lungime k de la vârful pc la vârful Pik Dacă există o cale care duce de la vârful Pi la vârful P), atunci vârful nj se numește accesibil de la vârful nt sau un descendent al vârfului u În acest caz, vârful nj este numit și strămoșul vârfului nj Se poate observa că problema găsirii unei secvențe de Operatori care transformă o stare în alta este echivalentă cu problema găsirii unei căi pe un graf Este adesea convenabil să atribuiți costuri arcurilor unui grafic care reflectă costul aplicării operatorului corespunzător Vom folosi notația c(n,, n^) pentru a desemna costul unui arc direcționat de la un vârf /z la n^ Costul unei căi între două vârfuri este apoi definit ca suma costurilor tuturor arce care leagă vârfurile acestui drum găsiți calea dintre două vârfuri care are costul minim În problemele de cel mai simplu tip, trebuie să găsim o cale (posibil având un cost minim) între un punct dat $ (reprezentând starea inițială) și un alt vârf dat t (reprezentând starea țintă) Două complicații evidente ale acestei sarcini simple sunt următoarele: Găsiți calea dintre vârful s și orice element al mulțimii de vârfuri {A} Găsiți o cale între orice element al mulțimii {sj și orice element al mulțimii {/,} Setul {M, numit setul țintă, nu trebuie specificat în mod explicit Ea poate fi definită implicit prin prisma proprietăților pe care le posedă descrierile stărilor corespunzătoare corespunzătoare scopului Graficul poate fi specificat atât explicit, cât și implicit Când sunt specificate în mod explicit, vârfurile și arcele sale (cu costurile corespunzătoare) trebuie listate explicit, să zicem, sub forma unui tabel Acest tabel poate conține o listă a tuturor nodurilor din grafic, vârfurile lor secundare și costurile tuturor arcelor asociate acestora Evident, specificația explicită se dovedește a fi practic inacceptabilă pentru graficele mari, iar pentru graficele cu un număr infinit de vârfuri, este imposibilă Cu modul implicit de setare se determină o mulțime finită {sj de vârfuri, care sunt vârfurile inițiale În plus, este definit operatorul Г, care, atunci când este aplicat oricărui vârf, oferă toate vârfurile sale copil și costurile arcelor corespunzătoare (În terminologia noastră de spațiu de stare, acest operator "moștenire" este definit Reprezentarea prin programe nedeterministe ca o mulţime de operatori aplicabili unei descrieri date a stării ) Aplicarea succesivă a operatorului Γ la elementele mulţimii {sj, la copiii lor, şi aşa mai departe la infinit, dă astfel o reprezentare pentru graficul definit implicit prin Γ și {sj În același timp, procesul de căutare în spațiul de stări a șirului de operatori care rezolvă problema corespunde transformării într-o formă explicită a unei părți suficient de mare a grafului dat implicit, astfel încât să includă un vârf care îndeplinește poartă Astfel, punctul central al rezolvării problemei folosind spațiul de stări este căutarea pe graficul tipului specificat Luarea în considerare a metodelor de căutare pe un grafic va fi amânată până la capitolul următor REPREZENTAREA SPAȚILOR DE STAT PRIN PROGRAME NEDETERMINISTICE ) Procesul de generare a spațiului de stare poate fi reprezentat prin diagrama bloc prezentată în Fig Aici simbolurile x și y sunt folosite pentru a desemna seturi de date arbitrare Rețineți că operatorul de atribuire "mulțimea y egală cu un membru al mulțimii Γ(y) de elemente, Orez Reprezentarea spațiului de stări cu un program nedeterminist Poziția inițială: variabila programului y (care parcurge descrierile stărilor) se presupune a fi egală cu structura datelor de intrare x, care descrie starea inițială Atribuire: se presupune că noua valoare a variabilei programului y este egală cu unul dintre elementele setului Г(y) de valori copil pentru vechea valoare y imediat după y" este nedeterministă în sensul că orice membru al mulțimii Γ(y) poate fi ales în timpul execuției sale Setul (poate infinit) al tuturor * modalităților posibile de executare a programului reprezentat de această diagramă bloc acoperă apoi întregul ') Această secțiune poate fi omisă la prima lectură dec Ch Reprezentarea sarcinilor în spațiul de stat ' spaţiul de stat (Cu această formulare, stările sunt descrise de valorile posibile ale variabilei programului y, care poate fi un set de date arbitrar complex ) Programele care folosesc instrucțiuni de atribuire (și altele) care permit alegeri nedeterministe în timpul execuției sunt numite non-deterministe ) Este adesea convenabil să se reprezinte implicit spațiul de stare al unei sarcini, folosind o diagramă bloc nedeterministă O astfel de diagramă bloc poate fi la fel de simplă ca exemplul canonic din Fig , dar poate fi și mai complex cu mai multe elemente nedeterministe și deterministe (Strict vorbind, în diagrama noastră de flux din Figura , ar trebui să dăm condiții de terminare și să dăm alte detalii, cum ar fi un test pentru verificarea faptului că mulțimea Γ(y) nu este goală Testul de terminare poate apărea la oricare dintre puncte marcate cu o cruce în diagrama noastră bloc În capitolul următor, vom oferi o definiție precisă a algoritmilor de creare a unui spațiu de stări și de iterare peste elementele acestuia ) În general, programele nedeterministe sunt legate de extinderea definițiilor operatorului obișnuit de atribuire și operatorului de ramificare a programelor deterministe Am văzut deja cum puteți folosi operatori de alocare nedeterminiști Acest tip de instrucțiune de atribuire, numită instrucțiune SELECT, este notat în diagrame de flux după cum urmează: eu y - ALEGEREA (F(x,y)} Aici, setul de date x este valoarea de intrare a acestui program Funcția F este o funcție completă care mapează intervalul comun al lui x și y la o submulțime nevidă din domeniul lui y Pentru a reprezenta acest subset, folosim notația {/•}, iar COOSE {F} înseamnă alegerea unui membru (orice membru) al acestui subset Acest membru este apoi atribuit ca o nouă valoare lui y (Permitem ca atribuirea să depindă atât de valoarea variabilei de intrare x, cât și de valoarea variabilei de program y disponibilă în prezent ) ') Cuvântul "nedeterminist" în sensul în care este folosit aici nu este deloc echivalent cu cuvântul "stohastic"; non-determinismul nu înseamnă prezența unor mecanisme aleatorii Reprezentarea prin programe nedeterministe Orez Reprezentând jocul celor cincisprezece ca un program nedeterminist În plus, extindem noțiunea de operator de sucursală Operatorul V-ramură în n direcții folosește n predicate pAx, y), , pn(x, y), care iau fie valoarea T (adevărat), fie F (fals) în intervalul comun de x și y, iar cel puţin unul dintre predicate trebuie să aibă valoarea T Fiecare predicat corespunde unei ramuri Se selectează o ramură (orice ramură) pentru care predicatul corespunzător are valoarea T Acest tip de ramificare nedeterministă se numește V-ramificare și se notează G l Reprezentarea sarcinilor în spațiul de stat tachinat după cum urmează: Rețineți că atribuirile și ramurile deterministe obișnuite sunt cazuri speciale simple ale operatorilor nedeterminiști În timpul execuției specifice a unui program nedeterminist, se fac alegeri specifice în instrucțiunile V-branch și SELECT Apoi setul tuturor execuțiilor posibile definește spațiul de stări Dacă pentru orice matrice de intrare există cel puțin o execuție specifică a unui program care are un final, atunci se spune că programul este bine definit Ca o modalitate de a da unei sarcini forma unui program nedeterminist, în Fig oferă un program posibil pentru a juca în cincisprezece Aici starea este descrisă de valoarea variabilei programului y, care aparține spațiului de tablouri X Elementele acestor tablouri sunt numerele de la la și caracterul ■ (reprezentând o celulă goală) Funcțiile STÂNGA, SUS, DREAPTA, JOS corespund operatorilor Ele modifică matrice prin deplasarea simbolului ■ la stânga, în sus, la dreapta, respectiv în jos Rezultă că pot fi definite și alte elemente ale programelor nedeterministe Aceste elemente sunt utile atunci când discutăm formulări bazate pe reducerea unei sarcini la subsarcini Ele vor fi discutate în cap CATEVA EXEMPLE DE VIZIUNI DE PROBLEME Pentru un număr mare de probleme, pot fi date reprezentări în spațiul de stare Pentru unele probleme, o astfel de reprezentare poate fi aleasă destul de firesc, în timp ce pentru altele, orice reprezentare asociată cu introducerea unui spațiu de stat pare foarte artificială Cititorul nu trebuie să presupună că fiecare dintre formulările prezentate în această secțiune este cea mai bună posibilă În același mod, nu ar trebui să fie surprins să vadă că poate rezolva addada dintr-o perspectivă diferită Pentru moment, vrem doar să arătăm că este într-adevăr posibil ca unele tipuri diferite de probleme să aibă o reprezentare în spațiul de stare Câteva exemple de vederi sarcini Problema vânzătorului ambulant Problema vânzătorului ambulant este o problemă combinatorie clasică Vânzătorul ambulant trebuie să-și construiască traseul în așa fel încât să viziteze fiecare dintre cele n orașe exact o dată și să se întoarcă în orașul de plecare Este de dorit ca acest traseu să aibă lungimea minimă posibilă Pentru rezolvarea problemei au fost dezvoltate mai multe metode eficiente, care sunt fezabile doar atunci când numărul de orașe nu depășește aproximativ Metodele aproximative dau soluții bune (deși nu minimizează neapărat lungimea traseului) deja pentru de orașe Problema vânzătorului ambulant este utilă pentru ilustrarea reprezentărilor bazate pe introducerea unui spațiu de stat, așa cum se poate observa din următorul exemplu particular simplu Orez Harta pentru problema vânzătorului ambulant Vânzătorul trebuie să viziteze fiecare dintre cele cinci orașe reprezentate pe harta din fig Între fiecare pereche de orașe există o cale, a cărei lungime este indicată pe această hartă Este necesar, începând din orașul L, să găsim calea cea mai scurtă pe care vânzătorul trece o dată prin fiecare dintre orașe și apoi se întoarce în orașul D Pentru a da o reprezentare în spațiul de stare, trebuie să definim următoarele; Descrieri de stat Vom seta statele ca o listă de orașe trecute până acum Deci, starea inițială va fi lista (D) Nu vom permite ca vreun oraș să fie menționat de mai multe ori în această listă, cu singura excepție că după ce toate celelalte orașe sunt menționate în ea, D poate fi menționat din nou Operatori Operatorii sunt calcule corespunzătoare acțiunilor: ( ) mergi acum în orașul D, ( ) mergi Ch Reprezentarea problemelor în spațiul statal acum la orașul B, , ( ) mergeți acum la orașul E Un operator nu este aplicabil unei descrieri de stat decât dacă o transformă într-o descriere validă Astfel, numărul operatorului ( ) (corespunzător "du-te acum în orașul D") nu se aplică nici unei descrieri care nu conține numele tuturor orașelor Criterii pentru atingerea scopului Orice descriere care începe și se termină cu orașul A și listează toate celelalte orașe este o descriere a unei stări care satisface obiectivul Pe fig , clasamente pe vizionare este prezentată o reprezentare a acestui spațiu cograf (Doar câțiva dintre ai lui (ACDEBA) Target Vertex și s O parte a graficului pentru problema vânzătorului ambulant R vârfuri ) Numerele scrise lângă arcele graficului indică costurile acestor arce' Presupunem că aceste costuri sunt egale cu distanțele dintre orașele respective (vezi Figura ) Vârfurile graficului conțin descrieri ale stărilor pe care le reprezintă Avantajele reprezentării grafice sunt Câteva exemple de vederi sarcini că atribuirea costurilor arcurilor ne oferă o modalitate convenabilă de a calcula lungimea totală a unui traseu și, prin urmare, o modalitate de a găsi cea mai scurtă dintre ele Cel mai scurt ( de mile) pentru cazul nostru este afișat în grafic cu săgeți aldine Problema vânzătorului ambulant este un exemplu de problemă în care informația conținută în formularea acesteia este reprezentabilă în formă grafică (o hartă a distanței) Ar trebui să aveți grijă să nu confundați niciun grafic utilizat în formularea problemei cu graficul spațiului de stare care este construit la rezolvarea problemei Sarcini de analiză Când lucrați cu limbi, deseori întâmpinați problema analizei În astfel de probleme, o anumită definiție formală este dată mai întâi prin specificarea unei gramatici care distinge o anumită clasă de șiruri de caractere Și apoi există întrebarea dacă un șir arbitrar aparține acestei clase Următorul exemplu ilustrează acest tip de sarcină Gramatică Să presupunem că definim o propoziție ca un șir de unul dintre următoarele tipuri: caracterul a urmat de caracterul b simbolul a este urmat de o propoziție o propoziție este urmată de b o propoziție este urmată de o altă propoziție Exemple de propoziții: aab, abaabab, aaaaab Câteva șiruri non-propoziție: aaa, aba, abaa Să presupunem că dorim să determinăm dacă șirul abaabab este o propoziție Atunci formularea acestei probleme în spațiul de stat arată astfel: Descrieri de stat O modalitate posibilă de a formula această problemă este să alegeți șirul abaabab în cauză ca stare inițială Atunci setul de stări admisibile va fi setul de șiruri obținute din acesta prin aplicarea acelor reguli de rescriere (sunt date mai jos) care definesc operatorii Operatori Definim operatori prin următoarele reguli de rescriere: (subșirul ab poate fi înlocuit cu caracterul S care denotă o propoziție) $ '$$ f ssf F Sf F °°F F °F Vedem că aceste reguli exprimă pur și simplu gramatica care definește conceptul de propoziție Ch Reprezentarea sarcinilor în spațiul de stat criteriul scopului Starea țintă este descrisă de un șir care constă dintr-un singur caracter Secvența de stări, care este o soluție la această problemă, are următoarea formă: abaabab Saabab SaSab SSab SSS SS S Graficul care ilustrează spațiul de stare pentru această problemă este prezentat în Fig În această problemă, s-a dovedit că Vârful de început - abaabab Saabab abaSab abaabs c Target Vertex Orez Grafic pentru problema analizei în virtutea gramaticii date, orice rând care începe cu a și se termină cu b este o propoziție Cunoașterea unui astfel de fapt ar face, evident, mult mai ușor să decideți dacă un șir arbitrar ar fi o propoziție Uneori se dovedește că o anumită gramatică poate fi reprezentată Câteva exemple de vederi sarcini len într-o formă echivalentă dar mai simplă Detectarea unor astfel de simplificări face posibilă construirea de spații mai mici pentru enumerare Sarcini de distribuție Următoarea problemă simplă este tipică unei clase de probleme numite uneori probleme de distribuție Există două surse de lichid: A dă de galoane pe minut și B - Sursele ar trebui să furnizeze două bazine C și D, fiecare dintre acestea având nevoie de de galoane pe minut bidon lichid sursa, Orez Locația surselor de fluide și a bazinelor (distanțele sunt măsurate în mile) să fie alimentat de la sursă la piscină folosind conducte cu o capacitate maximă de gpm Lăsați sursele și bazinele să fie localizate așa cum se arată în Fig , iar racordurile la conducte sunt permise numai în locațiile surselor și bazinelor Întrebarea este cum să conectați țevile astfel încât lungimea totală a țevilor să fie cea mai scurtă , Reprezentarea în spațiul de stare a acestei sarcini arată astfel: Descrieri de stat Stările sunt descrise printr-o listă de debite de fluid în exces, care este disponibilă în punctele A, B, C și D Astfel, starea inițială este descrisă printr-o listă (L = , B = , C = , D) = ) Operatori Operatorii corespund transferului excesului de "fluid pe minut" dintr-un punct în altul În sarcini, Ch Reprezentarea problemelor în spațiul statal ca acesta, excesul corespunzător este cel mai mare divizor comun al capacităților și cerințelor de fluid în diferite puncte Deci avem operatori: Transferați GPM de la L la B Transferați GPM de la L la S Transferați GPM de la B la A Desigur, operatorii sunt aplicabili numai atunci când există un exces suficient de lichid în punctul din care lichidul este retras pentru transfer în alt punct Și, desigur, pentru implementarea fiecărui astfel de transfer, trebuie să aveți o conductă adecvată criteriul scopului Starea țintă este descrisă printr-o listă (L = O, V = O, C = , D = ) Începeți de sus / /D = , V = , C = O, D = ) (A = , B = , C = , D = ) (D = , = , C D = ) (A \u d , \u d , C \u d , \u d ) Target Vertex Orez O parte a graficului pentru problema distribuției O parte din graficul astfel obținut în spațiul stărilor este prezentată în Fig Denumirea tipului A-*D de lângă Arcurile graficului indică faptul că operatorul respectiv transferă un surplus de GPM de la A la D Costurile înscrise lângă fiecare arc indică câte mile de țeavă trebuie adăugate pentru a furniza acel arc surplus Numărul zero în același timp Câteva exemple de vederi sarcini Se presupune că nu este nevoie să adăugați o altă conductă, deoarece conducta existentă are o capacitate suplimentară suficientă Graficul din fig Figura este incompletă - multe dintre vârfurile sale nu sunt afișate Prin examinarea graficului complet, se poate determina că calea care duce de la nodul inițial la nodul țintă și care are cel mai mic cost necesită mile de conducte Sarcini de control Într-o problemă tipică de control, există un proces reprezentat de un sistem de variabile "setate" care trebuie controlate folosind controlul corespunzător oferit de un anumit set de variabile de control masa problematica M atasa- Orez Myat-iik inversat pe un cărucior NYH Un exemplu interesant este problema pendulului inversat pe un cărucior (Figura ) În această linie, până la capătul tijei de lungime / Celălalt capăt este articulat de cărucior, astfel încât tija să se poată roti liber într-un plan vertical care coincide cu direcția de mișcare a căruciorului echipat cu roți Variabilele care trebuie stabilite sunt unghiul de înclinare al tijei Ѳ, coordonata x a căruciorului și derivata timpului Ѳ Este necesar ca valorile fiecăreia dintre aceste variabile să fie menținute în anumite limite predeterminate Variabila de control este viteza căruciorului x, care poate lua una dintre cele două valori -jo și -v (Pentru simplitate, presupunem că aceste valori se pot schimba una pe cealaltă instantaneu ) Sarcina principală aici este să decideți în acest moment dacă să mutați căruciorul cu viteza v spre dreapta sau cu viteza v spre stânga Descrierea stărilor Presupunând că variabilele Ѳ, Ѳ și x iau valori discrete cu un pas suficient de mic, putem considera starea ca un vector compus din aceste trei variabile (spațiul stărilor în acest caz este o rețea în spațiul tridimensional Ѳ , Ѳ ei) Operatori Există exact doi operatori: Aplicați control + ѵ Aplicați controlul -ѵ Ch Reprezentarea sarcinilor în spațiul de stat Starea rezultată din aplicarea unuia dintre acești operatori este pur și simplu starea descrisă de vectorul (Ѳ, Ѳ, x) după ce au trecut A/secunde (În multe probleme tipice de control, acțiunile operatorului pot fi reprezentate compact folosind ecuații diferențiale ) Criterii pentru atingerea scopului Să presupunem că starea țintă este descrisă de un vector (Ѳ = , Ѳ = , x = ) Apoi trebuie să găsim o secvență de operatori care să transforme orice stare dată într-un număr întreg Desigur, o astfel de secvență nu ar trebui să conducă la nicio stare descrisă de variabilele Ѳ, Ѳ și x, pentru care o întrerupere completă a sistemului este inevitabilă în cele din urmă (Apare la Ѳ - ± ° ) În unele probleme tipice de control, este adesea posibil să se obțină (prin metode analitice) ecuații de suprafață de separare care împart spațiul de stare vectorială în regiuni care nu se suprapun astfel încât același control (același operator) În aceste cazuri, un calcul simplu poate oferi un răspuns care altfel ar fi obținut prin căutare Cititorul ar trebui să înțeleagă că nu vom sugera utilizarea proceselor de căutare în cazurile în care sunt cunoscute metode directe de soluție Vrem doar să subliniem că deseori este posibil să se utilizeze metode eficiente de enumerare pentru rezolvarea acelor probleme pentru care nu s-au găsit încă metode directe SELECTAREA PERFORMANȚELOR "BUNE" Alegerea unei anumite reprezentări în spațiul de stat pentru o problemă dată determină în mod esențial eforturile de căutare care vor trebui făcute pentru a o rezolva Evident, sunt preferate reprezentările cu spații mici de stare (adică cele ale căror grafice au un număr mic de vârfuri) Există multe exemple de probleme care par dificile, dar astfel încât, dacă sunt interpretate corect, spațiile de stare corespunzătoare se dovedesc a fi foarte înguste Uneori, acest spațiu de stări "se micșorează până la un punct" după ce se descoperă că unele afirmații pot fi aruncate ca fiind inutile, în timp ce altele sunt combinate în declarații mai puternice Și chiar dacă astfel de transformări simple nu sunt fezabile, se poate dovedi că o reformulare completă a problemei, schimbarea însuși conceptul de stat, va duce la mai puțin spațiu Există încă prea puțină înțelegere a proceselor care sunt necesare pentru prezentarea inițială a sarcinilor și pentru Alegerea reprezentărilor "bune" îmbunătățirea acestor idei Se pare că progresul dorit în reprezentarea problemei depinde de experiența acumulată în încercarea de a rezolva problema în cadrul acestei reprezentări Această experiență ne permite să evidențiem concepte simplificatoare, cum ar fi proprietăți de simetrie sau secvențe utile de operatori, care ar trebui combinate în macrooperatori O idee extrem de importantă în domeniul reprezentărilor sarcinilor este legată de utilizarea variabilelor în descrierile stărilor Apoi, expresiile care conțin variabile pot fi folosite pentru a descrie un întreg set de stări, și nu doar una Înlocuirea unor valori private (constante) în locul acestor variabile în expresiile indicate oferă descrieri specifice ale stărilor O expresie care conține variabile care este folosită pentru a descrie un set de stări în sensul specificat se numește o schemă pentru descrierea stărilor Vom ilustra cu un exemplu utilizarea schemelor pentru a descrie stări Problema maimuței și bananei este adesea folosită în literatura despre inteligența artificială pentru a demonstra funcționarea soluțiilor automate de probleme concepute pentru a efectua inferențe de bun simț Problema poate fi formulată după cum urmează În camera în care se află maimuța, există o cutie și un buchet de banane, iar bananele sunt suspendate de tavan atât de sus încât maimuța nu poate ajunge la ele de pe podea Ce succesiune de acțiuni va permite maimuței să obțină aceste banane? (Mamuța ar trebui să meargă la cutie, să o tragă până la banane, să se cațere pe ea și să ia bananele ) Cum ar trebui să fie construite reprezentările spațiului de stat pentru această sarcină? Următoarele elemente trebuie să apară în mod necesar în descrierea stării: coordonatele maimuței din cameră (orizontal și vertical), coordonatele cutiei din cameră și dacă maimuța are banane Aceste elemente sunt reprezentate convenabil ca o listă de patru elemente (w, x, y, z), unde w sunt coordonatele maimuței în plan orizontal (vector bidimensional), x este sau , în funcție de locul unde se află maimuța, pe cutie sau nu, y - coordonatele casetei în plan orizontal (vector bidimensional), z este sau , în funcție de dacă maimuța a primit bananele sau nu Dacă fiecare valoare individuală a listei (w, x, y, z) ar descrie exact o stare, atunci am avea un număr infinit de stări, deoarece numărul de aranjamente diferite de obiecte din cameră este infinit Am putea face pro- Ch Reprezentarea sarcinilor în spațiul de stat Spațiul de stări este finit, presupunând că obiectele pot fi localizate doar la un număr finit de puncte (să zicem, puncte de rețea), dar totuși numărul de puncte suficient pentru sarcina în cauză ar duce la un spațiu de stare extrem de mare O altă modalitate este de a folosi scheme Variabilele incluse în schemă au valori parțiale (cum ar fi constante) care trebuie înlocuite în locul lor atunci când se aplică un operator sau când se verifică dacă scopul este atins Declarațiile din această sarcină corespund patru acțiuni posibile care pot fi efectuate de maimuță: ) abordare (și) -maimuța se duce într-un punct și într-un avion etajul camerei (și - variabil), ) mutare (v) - maimuța mută cutia în punctul v etajul camerei (ѵ - variabil), ) urcă în sus - maimuța se urcă pe cutie, ) apucă - maimuța apucă bananele Datorită prezenței variabilelor în "abordare", "deplasare" acești operatori sunt de fapt scheme Condițiile de aplicabilitate și acțiunile acestor operatori sunt date de următoarele reguli de rescriere: vino (și) (w, , y, z) > (u, , y, z), muta (v) (w, O, W, ) >(v, O, V, z), a urca, (W, O, W, ) ->(w, , W, ), apuca (s, , s, ) >(s, , s, ), unde c sunt coordonatele punctului de podea direct sub banane (un vector bidimensional) Utilizarea unor operatori, cum ar fi "mutare", implică limitarea valorilor variabilelor reprezentând coordonatele maimuței și ale casetei, care acum trebuie să fie aceleași Vom considera că două scheme de descriere a stărilor sunt identice dacă diferă doar în numele variabilelor În această formulare, elementele setului de stări țintă sunt descrise de orice liste al căror ultim element este unul Să presupunem că maimuța este la început în punctul a al podelei, iar cutia este la b Atunci descrierea stării inițiale va fi (a, , b, ) Singurul operator care este aplicabil în această stare este "abordarea" care rezultă în model (u, , b, ) Trei operatori sunt acum aplicabili Dacă u = b, atunci maimuța poate fie să se urce pe cutie, fie să o mute Indiferent de mărime, o maimuță se poate muta oriunde Alegerea reprezentărilor "bune" Mai mult Urcarea cutiei duce la o stare cu descriere (b, , b, ); mutarea casetei în ѵ duce la schemă (ѵ, ,v, ), iar mutarea într-un alt loc descris de o nouă variabilă nu schimbă descrierea Continuând procesul de aplicare a tuturor operatorilor, vom construi spațiul de stări ilustrat de graficul din Fig Vedem că acest grafic este foarte mic și este ușor să găsim o cale pe el care să rezolve problema noastră (bold Figura Grafic pentru problema maimuțelor și bananelor săgeți) Înlocuind în loc de variabile valorile lor private respective, așa cum se arată în Fig , obținem o succesiune de operatori: apropiere (b), mutare (c), urcare, apucare Aceasta încheie considerația noastră asupra chestiunii reprezentărilor problemelor în spațiul de stat Exemplele date în acest capitol au tratat mai multe aspecte ale problemei reprezentărilor, deși nu există încă o teorie satisfăcătoare a reprezentărilor și a schimbării reprezentărilor În capitolul următor, vom trece la o zonă mult mai avansată a tehnicilor de căutare în spațiul de stat Ch Reprezentarea sarcinilor în spațiul de stat NOTE BIBLIOGRAFICE SI ISTORICE Constituenții Reprezentării Statului-Spațial Cele trei elemente care alcătuiesc o reprezentare a spațiului de stare - descrieri de stare, operatori și criterii de obiective - au fost mult timp considerate centrale în domeniul soluționării automate a problemelor Aceste concepte sunt discutate în cartea lui Ernst și Newell ( ), care discută programul universal de rezolvare a problemelor Un studiu mai abstract al problemei descrierii stărilor și operatorilor poate fi găsit în Amarelle ( , ) Un exemplu de utilizare a regulilor de rescriere pentru a specifica operatori se găsește în sistemul de rezolvare a problemelor descris de Quinlan și Hunt ( ) Elementele principale ale limbajului teoriei grafurilor (arce, vârfuri, căi etc ) sunt adesea folosite în descrierea proceselor de rezolvare a problemelor Cărțile clasice despre teoria grafurilor sunt Berge ( ) și Ore ( ) Ore ( ) a scris și o carte populară elementară care conține aplicații ale teoriei grafurilor la diferite probleme combinatorii Programe nedeterministe Numele algoritm nedeterminist a fost propus de Floyd ( a) Floyd a permis utilizarea funcției "alegerea" în astfel de algoritmi pentru a simplifica descrierea strategiilor de căutare exhaustive Manna ( ) a descris mai târziu o clasă de programe care permiteau atât instrucțiuni de atribuire nedeterministe (cum ar fi funcțiile de alegere), cât și operații de ramuri nedeterministe El a oferit o metodologie pentru a demonstra corectitudinea (corectitudinea) programelor care conțin aceste elemente noi Într-o lucrare anterioară, Manna ( ) s-a ocupat de problema dovedirii corectitudinii programelor convenționale (deterministe) Feike ( ) a descris un sistem complet de rezolvare a problemelor în care problemele sunt puse într-un limbaj procedural care permite utilizarea funcțiilor de alegere nedeterministe Literatură cheie despre exemple de probleme Exemplele de probleme pe care le-am folosit pentru a ilustra metodele din spațiul de stare sunt legate de diferite domenii, fiecare având propriile metode tradiționale specializate de rezolvare Multe dintre aceste metode pot fi văzute ca aplicând o abordare a spațiului de stare Ar fi foarte util ca cititorul să încerce, ca exercițiu, să traducă descrierile acestor speciale Sarcini metode lizate într-un limbaj convențional de reprezentare a spațiului de stare Problema vânzătorului ambulant ocupă un loc important în teoria cercetării operaționale O trecere în revistă a rezultatelor la aceasta poate fi găsită în Bellmore și Nemhozer ( ) Sarcinile de analiză sunt frecvente în studiul limbilor Feldman și Gries ( ) oferă o imagine de ansamblu cuprinzătoare a metodelor de parsare utilizate de sistemele de traducere pentru limbaje de calcul formale Amarelle ( ) discută analiza din punctul de vedere al rezolvării automate a problemelor și propune o procedură bazată pe reducerea unei probleme la subsarcini O discuție accesibilă despre utilizarea șirurilor și simbolurilor și a sistemelor lor de producție ca modele de calcul se găsește în ultimele capitole ale cărții lui Minsky ( ) despre calcul Multe probleme, cum ar fi distribuția, firele de execuție și cozile de așteptare, pot fi rezolvate prin metoda spațiului de stare Ele sunt discutate în cartea lui Ford și Fulkerson ( ) Teoria controlului este o zonă specială mare, cu o varietate de metode de rezolvare a problemelor care apar aici De Russo, Roy and Close ( ) este o bună introducere în teoria managementului modern Problema găsirii unei reprezentări bune Căutarea unei reprezentări bune a fost luată în considerare doar de câțiva cercetători și, în special, de Amarel Amarelem ( ) a scris o lucrare clasică pe acest subiect În ea, el arată succesiv cititorului o serie de idei îmbunătățite progresiv pentru problema misionarilor și canibalilor Un puzzle interesant care evidențiază importanța alegerii unei reprezentări bune a fost remarcat de McCarthy ( ) Problema maimuțelor și bananelor este un exemplu standard al problemei raționamentului de bun simț Este considerată în detaliu de Amarel ( ) Sa observat că utilizarea schemelor pentru a descrie stările este o modalitate puternică de a reprezenta o problemă Cea mai recentă versiune a solutorului universal de probleme permite utilizarea schemelor obiect cu variabile, așa cum se face în sistemul de rezolvare a problemelor lui Faix ( ) Lucrarea lui Newell ( ) explorează câteva abordări posibile (și limitările asociate acestora) ale problemei obținerii unei reprezentări bune Sarcini (Problemele marcate cu un asterisc pot dura câteva ore pentru a fi finalizate Unele dintre aceste probleme ar putea face obiectul unui articol de studiu ) Ch Reprezentarea problemelor în spațiul statal Locomotiva L și vagoanele sunt pe calea prezentată mai jos în ordinea (de la stânga la dreapta) care poate fi reprezentată prin șirul LABCD; Să presupunem că locomotiva poate fi decuplată și cuplată în mod arbitrar la vagoane individuale, comutatoarele pot ocupa o poziție arbitrară, iar locomotiva poate trage și împinge vagonul la care este cuplată Specificați un set de reguli de rescriere a șirurilor care ar putea fi utilizate pentru a crea reprezentări pentru toate locațiile posibile ale vagoanelor și locomotivelor pe un segment drept Săgeată La Un arc între un vârf n și un vârf tij care îl urmează se spune că este ireversibil dacă PI este inaccesibil de la Π) Dați două exemple de probleme pentru care graficele spațiului de stare conțin arce nerecurente Arătați, prin găsirea căii adecvate pe graficul reprezentând spațiul de stări, că șirul (((), ()), (), ((), ())) este o propoziție S în gramatica definită de următoarea rescriere reguli: a) S+-() b) R-eS c) A A, A d) S^-(A) Aceste reguli de rescriere presupun că caracterul din stânga săgeții poate fi înlocuit cu subșirul de caractere din dreapta săgeții oriunde în șirul unde apare subșirul Găsiți o formă de descriere a stării, operatori și criterii de realizare a obiectivelor pentru următoarea problemă cu ulcior Se ia un ulcior de galoane cu apa si un ulcior gol de galoane Cum obțineți exact un galon într-un ulcior de galoane? Apa poate fi turnată sau turnată dintr-un ulcior în altul Desenați partea din arborele de iterație care corespunde pașilor pe care îi parcurgeți pentru a găsi o soluție Pentru următoarea problemă despre opt matci, indicați forma descrierii de stat, operatori și criteriul pentru atingerea scopului Așezați dame pe o tablă de șah obișnuită, astfel încât fiecare orizontală, verticală și diagonală nu stătea mai mult de o regină Desenați o parte din graficul de stare și furnizați nodurile și arcurile acestuia cu descrieri adecvate Scrieți un program de calculator care generează un set de șiruri care poate fi obținut prin înlocuirea subșirului Si cu subșirul S în toate locurile șirului dat S unde apare subșirul Sj Sarcini * Citiți Amarel ( ) despre reprezentări Rețineți că Amarel începe cu o idee foarte primitivă, lucrează puțin cu ea și apoi treptat en? se îmbunătățește Efectuați o analiză detaliată a următoarei probleme menționate de McCarthy ( ): Arătați că acum este imposibil să acoperiți complet această placă deformată cu X piese, astfel încât acestea să nu iasă dincolo de marginea plăcii și să nu se suprapună La un moment dat în cercetarea dvs asupra unei probleme, poate doriți să lucrați cu placa X , apoi placa X și așa mai departe, pentru a găsi concepte care sunt convenabile pentru reprezentarea cazului general Scrieți un raport despre munca la această sarcină și, în concluzie, indicați observațiile pe care le puteți avea cu privire la dificultatea acestei sarcini de prezentare capitolul METODE DE CĂUTARE A SPATIULUI DE STAT PROCESE DE CĂUTARE PE UN GRAF Atunci când o problemă este formulată în spațiul stărilor, soluția se obține prin aplicarea operatorilor descrierilor stărilor până când se obține o expresie care descrie starea care corespunde atingerii scopului Folosind exemplele din capitolul anterior, am văzut cum pot fi folosite graficele pentru a ilustra spațiile de stare Limbajul grafic este extrem de util pentru descrierea strategiilor eficiente de enumerare a spațiului de stare (căutare) Toate metodele de enumerare a spațiului de stare pe care le vom discuta pot fi modelate folosind următorul proces teoretic grafic: Vârful inițial corespunde descrierii stării inițiale Vârfurile imediat care urmează unuia dat sunt obținute prin utilizarea operatorilor care se aplică descrierii stării asociate cu acel vârf Fie Γ un operator special care construiește toate vârfurile imediat după cel dat Vom numi procesul de aplicare a operatorului Γ la un vârf care deschide vârful Pointerii merg de la fiecare astfel de vârf ulterior la cel care l-a generat Acești indicatori fac posibilă găsirea unei căi de întoarcere la vârful de pornire, după ce vârful țintă a fost găsit - Pentru nodurile care urmează celui dat se verifică dacă sunt vârfurile țintă (Adică, verificând dacă descrierile corespunzătoare definesc stări care se potrivesc cu ținta ) Dacă vârful țintă nu a fost încă găsit, atunci procesul de extindere a vârfurilor (și setarea pointerilor) continuă Când se găsește vârful țintă, acești indicatori sunt priviți în direcția opusă - de la țintă până la început, în urma căreia este dezvăluită calea soluției Atunci operatorii de peste descrierile stărilor asociate cu arcele acestei căi formează o secvență decisivă Pașii de mai sus descriu pur și simplu elementele de bază ale procesului de enumerare, similar cu descrierea dată de bloc Metode de forță brută schema unui program nedeterminist Cu o descriere completă a procesului de enumerare, este de asemenea necesar să se precizeze ordinea în care ar trebui extinse vârfurile Dacă vârfurile sunt extinse în aceeași ordine în care sunt generate, atunci se obține un proces, care se numește enumerare exhaustivă (proces de lățime-întâi) Dacă, pe de altă parte, vârful care a fost construit cel mai recent este întotdeauna deschis primul, atunci se obține un proces de adâncime mai întâi Procesele de căutare cu forță brută și de căutare în profunzime mai întâi pot fi numite și proceduri de căutare oarbă, deoarece locația țintei nu afectează ordinea în care sunt extinse vârfurile Este posibil, totuși, să avem câteva informații euristice despre natura globală a graficului și locația generală a țintei de căutare (Cuvântul euristic înseamnă "slujește descoperirea") Acest tip de informații poate fi adesea folosit pentru a "împinge" căutarea către obiectiv, dezvăluind mai întâi cele mai promițătoare vârfuri În acest capitol, vom descrie câteva metode de enumerare euristică din perspectiva teoriei grafurilor Dar mai întâi, vom introduce câteva idei de bază legate de enumerare, analizând metodele de enumerare oarbă mai detaliat Esența acestor metode va deveni mai clară dacă ne limităm la a lua în considerare arbori mai degrabă decât grafice arbitrare Un arbore este un grafic, fiecare vârf al căruia are exact un vârf imediat precedent (părinte), cu excepția unui vârf distinct, numit rădăcină a arborelui, care nu are niciun vârf precedat Astfel, rădăcina arborelui servește ca vârf de pornire Pentru enumerare, arborii sunt mai simpli decât graficele, în primul rând pentru că atunci când construim un nou vârf, putem fi siguri că acesta nu a fost niciodată construit înainte și nu va mai fi construit niciodată Astfel, calea de la rădăcină la vârful dat este unică După ce am descris metodele de căutare oarbă pentru arbori, vom arăta cum ar trebui să fie modificate în cazul graficelor arbitrare METODE DE BRUTAINING În metoda forței brute, vârfurile sunt extinse în ordinea în care sunt construite Un algoritm simplu de căutare în arbore constă din următoarea secvență de pași: ( ) Puneți vârful de pornire într-o listă numită DESCHIS ( ) Dacă lista DESCHISĂ este goală, atunci ieșirea este semnalată despre eșecul căutării, în caz contrar treceți la pasul următor Ch Metode de căutare în spațiul de stare ( ) Luați primul vârf din lista DESCHIS și mutați-l în lista ÎNCHIS; Să numim acest vârf ( ) Extindeți vârful n, formând toate vârfurile imediat următoare n Dacă nu există vârfuri imediat următoare, atunci treceți imediat la pasul ( ) Plasați vârfurile imediat după n la sfârșitul listei OPEN și construiți pointeri care duc de la ele înapoi la n Orez Diagrama bloc a programului algoritmului de căutare exhaustivă pentru arbori ( ) Dacă oricare dintre acestea imediat următoare n vârfuri sunt vârfuri țintă, atunci scoateți soluția obținută prin privirea de-a lungul pointerilor; în caz contrar, treceți la pasul ( ) Metode de forță brută - Acest algoritm presupune că vârful inițial nu satisface scopul stabilit, dar nu este dificil de introdus etapa verificării acestei posibilități Schema bloc a algoritmului este prezentată în fig Vârfurile și pointerii construiți în timpul iterației formează un subarboresc al întregului arbore de spațiu de stare definit implicit Vom numi un astfel de subarbore arbore de enumerare Este ușor de arătat că metoda forței brute va găsi cu siguranță calea cea mai scurtă către vârful țintă, cu condiția ca o astfel de cale să existe (Dacă nu există o astfel de cale, atunci metoda specificată va declara eșecul în cazul graficelor finite, iar în cazul graficelor infinite, algoritmul nu își va termina niciodată munca ) Pe fig Figura prezintă arborele de căutare rezultat în urma căutării exhaustive aplicate jocului de opt (Graficul de stare-spațiu pentru jocul celor opt nu este cu adevărat un arbore, dar acest fapt este irelevant, deoarece în procesul considerat de iterare peste unul, același vârf nu poate apărea niciodată de la mai mult de un vârf părinte ) Problema este pentru a transforma configurația din stânga în configurația din dreapta: ■ Descrierile corespunzătoare ale stărilor sunt plasate în vârful copacului Aceste vârfuri sunt numerotate în ordinea în care au fost obținute în timpul expansiunii ); ramura în negru reprezintă o soluție în cinci trepte (Săgețile de pe arce sunt omise deoarece originea fiecărui vârf este clară în acest caz ) Rețineți că de vârfuri au fost descoperite și construite înainte ca această soluție să poată fi găsită O examinare directă a acestui grafic arată, de asemenea, că nu există o soluție care să conțină mai puțini pași Pot exista probleme în care soluției se impun alte cerințe, diferite de cerința de a obține cea mai scurtă secvență de operatori Atribuirea anumitor prețuri arcurilor arborelui (cu găsirea ulterioară a unei căi de decizie care are un minim ') Ordinea vârfurilor ulterioare corespunde mișcării celulei goale mai întâi la stânga, apoi în sus, la dreapta și în jos ■ Orez Arborele s-a format Target Vertex în procesul de enumerare completă Metode de forță brută cost) îndeplinește multe dintre aceste criterii generalizate, așa cum sa văzut din mai multe exemple din capitolul anterior O versiune mai generală a metodei de căutare exhaustive, numită metoda prețului egal, permite în toate cazurile găsirea unei căi de la vârful inițial la vârful țintă, al cărei cost este minim În timp ce algoritmul tocmai descris propagă linii cu lungime de cale egală de la vârful de pornire, algoritmul mai general care va fi descris mai jos propagă linii cu cost de cale egal Se presupune că ni se oferă o funcție de cost с(гц, nj), care oferă costul tranziției de la vârful Pi la un următor vârf n În metoda prețului egal, pentru fiecare nod n din arborele de căutare, trebuie să ne amintim costul căii construite de la nodul inițial s la nodul n Fie g(n) costul căii de la nodul s la nodul n în arborele de căutare În cazul arborilor de enumerare, putem fi siguri că g(ri) este și costul căii care are costul minim (deoarece această cale este unică) În metoda prețului egal, vârfurile sunt dezvăluite în ordinea crescătoare a costului g(n) Această metodă este caracterizată de următoarea secvență de pași: ( ) Puneți vârfurile de pornire s într-o listă numită DESCHIS Puneți g'(s) = ( ) Dacă lista DESCHISĂ este goală, atunci eșecul căutării este semnalat la ieșire; în caz contrar, treceți la pasul următor ( ) Luați din lista DESCHIS vârful pentru care valoarea lui g are cea mai mică valoare și plasați-l într-o listă numită ÎNCHIS Dați acestui vârf numele n (Dacă valorile se potrivesc, alegeți în mod arbitrar vârful cu g minim, dar întotdeauna acordând preferință vârfului țintă ) ( ) Dacă n este vârful țintă, atunci scoateți calea de decizie obținută prin privirea înapoi în funcție de pointeri; în caz contrar, treceți la pasul următor ( ) Extindeți vârful n construind toate vârfurile imediat următoare [Dacă nu există, atunci treceți direct la pasul ( ) ] ,Pi) Puneți aceste vârfuri, împreună cu valorile lor corespunzătoare tocmai găsite £ în lista OPEN și construiți pointeri care se întorc la n ( ) Treceți la pasul ( ) Schema bloc a acestui algoritm este prezentată în fig Rețineți că verificarea dacă un vârf este ținta Ch Metode de căutare în spațiul de stare Orez Diagrama bloc a programului de algoritm de preț egal pentru arbori este inclusă în această schemă, astfel încât să fie garantată găsirea căilor de cost minim Vedem că algoritmul de preț egal poate fi folosit și pentru a găsi căi de lungime minimă prin simpla setare a costului fiecărei margini la una Dacă există mai multe vârfuri inițiale, atunci algoritmul se modifică pur și simplu: la pasul ( ), toate nodurile inițiale sunt plasate în lista DESCHIS Dacă statele care îndeplinesc scopul pot fi descrise în mod explicit, atunci despre Metoda de căutare în profunzime procesul de enumerare poate fi început în sens invers, luând vârfurile țintă ca cele inițiale și folosind inversarea operatorului G METODA DE RUPARARE A ADÂNCII Metodele de căutare în profunzime, în primul rând, sunt dezvăluite acele vârfuri care au fost construite ultimele Să definim adâncimea unui vârf din arbore după cum urmează: Adâncimea rădăcinii copacului este zero Adâncimea oricărui vârf următor este egală cu unu plus adâncimea vârfului imediat anterior Astfel, nodul cu cea mai mare adâncime în arborele de enumerare în acest moment este cel care ar trebui extins în acel moment Această abordare poate duce la desfășurarea procesului pe o cale inutilă, așa că trebuie introdusă o procedură de returnare După ce procesul construiește un vârf cu o adâncime mai mare decât o anumită adâncime a graniței, extindem vârful cu cea mai mare adâncime care nu depășește limita respectivă și așa mai departe Metoda de căutare în profunzime este definită de următoarea secvență de pași: ( ) Puneți vârful de pornire într-o listă numită DESCHIS ( ) Dacă lista DESCHISĂ este goală, atunci căutarea eșuează, în caz contrar treceți la pasul ( ) ( ) Luați primul vârf din lista DESCHIS și mutați-l într-o listă numită ÎNCHIS Să fie numit acest vârf ( ) Dacă adâncimea vârfului n este egală cu adâncimea limitei, atunci mergeți la ( ), în caz contrar mergeți la ( ) ( ) Extindeți vârful n construind toate vârfurile imediat următoare Plasați-le (în nicio ordine anume) la începutul listei OPEN și construiți pointeri mergând de la ele până în partea de sus a lui n ( ) Dacă unul dintre aceste vârfuri este ținta, atunci scoateți soluția uitându-vă la pointerii corespunzători pentru aceasta, altfel mergeți la pasul ( ) Pe fig Figura prezintă o diagramă pentru metoda de căutare în profunzime Arborele care rezultă din aplicarea căutării în profunzime la același joc de opt ca înainte este prezentat în Figura Trebuie să găsesc din nou Orez Adâncime-primul-primul-primul-primul-primul-primul-primul-primul-arborele Target Vertex Orez Un copac construit prin iterarea în profunzime Ch Metode de căutare în spațiul de stare secvența de mișcări pentru a transforma configurația din stânga în cea dreaptă: ■ t ■ Vârfurile aici sunt numerotate în ordinea în care au fost dezvăluite, iar adâncimea graniței este aleasă să fie (adică sunt căutate căi care duc la obiectiv, a căror lungime nu este mai mare de cinci) Vedem că algoritmul de căutare depth-first iterează mai întâi de-a lungul unei căi până la atingerea adâncimii maxime, apoi ia în considerare căi alternative de aceeași adâncime sau mai mică care diferă de acesta doar în ultimul pas, după care căi care diferă în ultimele două sunt luate în considerare etapele etc MODIFICĂRI LA CĂUTAREA PE GRAFICE ARBITRARE Atunci când iterați mai degrabă pe grafice decât pe arbori, trebuie făcute unele modificări naturale acestor algoritmi Într-o metodă simplă de forță brută, nu trebuie făcute modificări; este necesar doar să verificați dacă noul nod construit este deja în listele DESCHIS sau ÎNCHIS din motivul că a fost deja construit mai devreme ca urmare a deschiderii unui vârf Dacă da, nu trebuie să fie plasat înapoi în lista DESCHIS Trebuie făcute câteva modificări mai complexe la algoritmul de preț egal: ( ) Dacă vârful nou construit este deja în lista DESCHIS, atunci nu ar trebui adăugat din nou la această listă Cu toate acestea, valoarea costului g corespunzătoare acestuia se poate dovedi acum a fi mai mică (poate fi găsită o cale mai puțin costisitoare) Asociem întotdeauna vârfurile listei OPEN cu cele mai mici valori g pe care le avem până acum În același mod, indicatorul de la un vârf ar trebui să indice întotdeauna către vârful părinte situat pe calea care are cel mai mic cost dintre toate căile către acest vârf luate în considerare până acum ( ) Dacă vârful nou construit este deja în lista ÎNCHIS, atunci s-ar părea posibil ca pentru acesta valoarea & să se dovedească a fi mai mică decât înainte, deoarece direcția de îndreptare a acestuia Discuție despre informații euristice corpul trebuie reselectat Dar în realitate acest lucru nu se întâmplă Mai târziu vom demonstra că dacă, în algoritmul Equal Price, un anumit nod este plasat în lista ÎNCHIS, atunci cea mai mică valoare posibilă a lui g a fost deja găsită (și deci calea cu cel mai mic cost care duce la acest nod) Înainte de a face orice modificări ale algoritmului de căutare depth-first, trebuie să decidem ce se înțelege prin adâncimea unui vârf într-un grafic Conform definiției obișnuite, adâncimea unui vârf este egală cu unu plus adâncimea celui mai apropiat vârf părinte, adâncimea vârfului inițial fiind presupusă a fi zero Apoi s-ar putea obține o căutare mai întâi în adâncime, alegând extinderea celui mai adânc vârf al listei OPEN (fără a depăși adâncimea limită) Când se generează vârfuri care sunt deja fie în lista DESCHISĂ, fie în lista ÎNCHISĂ, poate fi necesar să se recalculeze adâncimea unui astfel de vârf Chiar și în cazul în care enumerarea este efectuată pe un graf complet, setul de vârfuri și pointeri construit în procesul de enumerare formează totuși un arbore (Indicatorii indică în continuare doar un singur nod părinte ) Pentru restul acestui capitol, avem de-a face cu cazul general al căutării pe un graf și, prin urmare, algoritmii pe care îi vom discuta țin cont în mod explicit de aceste modificări suplimentare DISCUȚIE DE INFORMAȚII EURISTICE Căutarea oarbă, căutarea exhaustivă sau metodele de căutare în profunzime sunt proceduri exhaustive pentru găsirea căilor către un vârf țintă În principiu, aceste metode oferă o soluție la problema găsirii căii ), dar adesea aceste metode nu pot fi utilizate, deoarece căutarea va trebui să dezvăluie prea multe vârfuri înainte de a găsi calea dorită Deoarece există întotdeauna limite practice privind timpul de calcul și cantitatea de memorie alocată pentru enumerare, trebuie să căutăm alte metode care sunt mai eficiente decât metodele de enumerare oarbă Pentru multe probleme, pot fi formulate reguli pur empirice pentru a reduce cantitatea de enumerare Toate aceste reguli folosite pentru a accelera căutarea depind de informațiile specifice despre sarcină, reprezentate sub formă de grafic Să numim acest tip de informație euristică? informații (care ajută la găsirea unei soluții) și nume ') În cazul căutării în profunzime cu o restricție suplimentară privind lungimea maximă admisă a căii - Notă, trad Ch Metode de căutare în spațiul de stare folosind procedurile sale de căutare prin metode de căutare euristică O modalitate de a reduce enumerarea este să alegeți un operator Γ mai "informat" care să nu construiască atât de multe vârfuri irelevante Această metodă este aplicabilă atât în metoda forței brute, cât și în metoda căutării în profunzime O altă modalitate este utilizarea informațiilor euristice pentru a modifica pasul ( ) al algoritmului de căutare în profunzime În loc să plaseze vârfurile nou construite într-o ordine arbitrară la începutul listei OPEN, acestea pot fi plasate în ea într-un mod specific, în funcție de informațiile euristice Deci, atunci când se repetă în profunzime, vârful care pare a fi cel mai bun va fi dezvăluit mai întâi O modalitate mai flexibilă (și mai costisitoare) de a utiliza informațiile euristice este de a reordona vârfurile listei DESCHIS la fiecare pas în funcție de un anumit criteriu În acest caz, enumerarea ar putea merge mai departe în acele tronsoane ale graniței care par a fi cele mai promițătoare Pentru a aplica procedura de ordonare avem nevoie de o măsură care să ne permită să evaluăm "promiterea" vârfului Astfel de măsuri se numesc funcții de evaluare După cum se poate observa, uneori este posibil să se izoleze informații euristice (euristice) care reduc efortul depus pentru enumerare (la o valoare mai mică, să zicem, decât în căutarea prin metoda prețului egal), fără a pierde posibilitatea garantată de a găsi calea cu cel mai mic cost Euristicele utilizate mai frecvent reduc mult cantitatea de muncă asociată cu enumerarea, cu prețul renunțării la garanția de a găsi calea cu cel mai mic cost în unele sau în toate problemele Dar în majoritatea problemelor practice, suntem interesați să minimizăm o anumită combinație a costului unei căi și a costului de enumerare necesar pentru a găsi acea cale - Mai mult decât atât, suntem de obicei interesați de metodele de enumerare care minimizează o astfel de combinație, mediate pe toate problemele pe care le putem întâlni (În calcularea acestui cost mediu, trebuie să folosim ponderi proporționale cu frecvența de apariție a fiecărei sarcini, astfel încât să permitem costuri mai mari pentru sarcinile rare dacă acestea sunt compensate cu costuri mai mici pentru sarcinile care apar frecvent ) Dacă costul combinațional mediu al uneia metoda de enumerare este mai mică decât costul corespunzător al altei metode, atunci spunem că prima metodă cu forță brută are mai multă putere euristică decât a doua Rețineți că, după definiția noastră, nu este deloc necesar (deși acest lucru este de obicei înțeles greșit) ca o metodă de enumerare care are o putere euristică mai mare decât alta să garanteze Utilizarea funcțiilor de evaluare posibilitatea de a găsi căi cu costuri minime pe care le-ar putea oferi o altă metodă Costurile combinaționale medii nu sunt niciodată calculate efectiv, atât pentru că este dificil să alegeți o modalitate de a combina costul traseului și costul forței brute, cât și pentru că nu ar fi ușor să găsiți o distribuție a probabilității asupra setului de probleme care ar putea fi întâlnite Astfel, a decide dacă o metodă de forță brută are o putere euristică mai mare decât alta se bazează de obicei pe intuiția expertă, susținută de experimente reale cu aceste metode * UTILIZAREA FUNCŢIILOR DE EVALUARE După cum am observat deja, modalitatea obișnuită de a utiliza informațiile euristice este utilizarea funcțiilor de evaluare pentru a eficientiza enumerarea Funcția de evaluare ar trebui să ofere abilitatea de a clasifica nodurile - candidați pentru dezvăluire - pentru a selecta vârful care este cel mai probabil să fie pe calea cea mai bună către obiectiv Funcțiile de evaluare au fost construite pe baza diferitelor considerente S-au făcut încercări de a determina probabilitatea ca un vârf să fie situat pe cea mai bună cale De asemenea, sa propus să se utilizeze distanța sau alte măsuri de diferență între un vârf arbitrar și un set de vârfuri țintă În jocurile de salon sau puzzle-uri, unei poziții i se atribuie adesea un anumit număr de puncte în funcție de trăsăturile pe care le posedă, care par a fi legate de gradul de încredere că este un pas către obiectiv Să presupunem că este dată o funcție f care ar putea fi folosită pentru a ordona vârfurile înainte de a le extinde Notăm cu f(n) valoarea acestei funcții la vârful n Deocamdată, vom presupune că f este o funcție arbitrară Mai târziu vom presupune că acesta coincide cu estimarea costului celui al căilor care merg de la vârful inițial la vârful țintă și trec prin vârful n, al cărui cost este cel mai mic (dintre toate astfel de căi) Să fim de acord să aranjam vârfurile destinate dezvăluirii în ordine crescătoare a valorilor lor ale funcției f Apoi se poate folosi un algoritm (similar algoritmului de prețuri egale), în care pentru următoarea extindere se alege partea de sus a listei DESCHIS, pentru care valoarea lui f este cea mai mică Vom numi o astfel de procedură un algoritm de căutare ordonată Pentru ca acest algoritm de enumerare ordonată să fie aplicabil la enumerarea pe grafice arbitrare (și nu doar pe dec Ch Metode de căutare în spațiul de stare arbori), este necesar să se prevadă în el posibilitatea de a lucra în cazul construirii vârfurilor care se află deja fie în lista DESCHISĂ, fie în lista ÎNCHIS Când folosiți o funcție arbitrară f, trebuie să țineți cont de faptul că valoarea lui f pentru un vârf din lista ÎNCHIS poate scădea dacă este găsită o nouă cale către aceasta (f(n) poate depinde de calea de la s la n chiar și pentru vârfuri ale listei ÎNCHIS) Prin urmare, trebuie să mutăm astfel de vârfuri înapoi în lista OPEN și să avem grijă să schimbăm direcțiile pointerilor corespunzătoare După luarea acestor măsuri necesare, algoritmul de căutare ordonată poate fi reprezentat prin următoarea secvență de pași: ( ) Puneți vârful de pornire s într-o listă numită OPEN și calculați f(s) ( ) Dacă lista DESCHISĂ este goală, atunci se semnalează o eroare la ieșire; vL în caz contrar, treceți la pasul următor ( ) Luați din lista DESCHIS vârful pentru care f are cea mai mică valoare și plasați-l într-o listă numită ÎNCHIS Dați acestui vârf numele n (Dacă valorile lui f pentru mai multe vârfuri se potrivesc, alegeți vârful cu minimul f în mod arbitrar, dar întotdeauna acordând preferință vârfului țintă ) ( ) Dacă n este vârful țintă, atunci scoateți calea de decizie obținută prin trasarea pointerilor corespunzători; în caz contrar, treceți la pasul următor ( ) Extindeți vârful n construind toate vârfurile imediat următoare (Dacă nu există, mergeți direct la ( ) ) Pentru fiecare astfel de vârf copil tu, calculați valoarea lui ț (П{) ( ) Asociați cu cele ale vârfurilor n" care nu sunt încă în listele DESCHIS sau ÎNCHIS valorile/(tii) tocmai calculate Plasați aceste vârfuri în lista OPEN și trageți n pointeri de la ele la vârf ( ) Asociați cu cele din imediat următoare n vârfuri care se aflau deja în listele DESCHIS sau ÎNCHIS, cea mai mică dintre valorile anterioare și tocmai calculate ale lui f Puneți în listă DESCHIDERE cele imediat următoare n vârfuri pentru care noua valoare a lui f este mai mică și schimbați direcția pointerilor de la toate vârfurile pentru care valoarea lui f a scăzut, indicând spre n ( ) Mergeți la ( ) Structura generală a algoritmului este identică cu cea a algoritmului de preț egal (vezi Figura ), așa că nu oferim o diagramă de flux pentru acesta Rețineți că setul de vârfuri și pointeri generați de acest algoritm formează un arbore (arborele de tranziție) Utilizarea funcțiilor de evaluare bor), iar la capetele acestui arbore se află vârfuri din lista OPEN Funcționarea algoritmului poate fi explicată cel mai ușor luând în considerare din nou același exemplu de joc de opt Vom folosi următoarea funcție simplă de evaluare: ț(n) = g(n) + W(n), unde g(n) este lungimea căii din arborele de căutare de la vârful inițial la vârful n și W(n) este numărul de jetoane care nu se află pe Target Vertex locul ei în descrierea stării asociate vârfului n valoarea lui f este + - Prin presupunere, vârful cu cea mai mică estimare este cel cu cea mai mare probabilitate pe calea optimă Pe fig arată rezultatul aplicării algoritmului de enumerare ordonată la jocul de opt și folosirea unei astfel de evaluări funcţie Valoarea lui f pentru P și c Arborele construit la fiecare vârf este dat de procesul de enumerare ordonată, în interiorul cercului Separat numerele în picioare arată ordinea în care au fost dezvăluite vârfurile Vedem că a fost găsită aceeași cale de soluție, care a fost obținută prin alte metode de enumerare, dar utilizarea funcției de evaluare a condus la un număr semnificativ mai mic de dezvăluiri de vârfuri Alegerea funcției de evaluare afectează foarte mult rezultatul enumerării Utilizarea unei funcții de evaluare care nu ține cont de adevăratele perspective ale unor vârfuri poate duce la construirea de trasee care nu au un cost minim Pe de altă parte, folosind o funcție de evaluare care Cap Metode de căutare în spațiul de stare acordă prea multă importanță posibilelor perspective ale tuturor nodurilor (cum ar fi în algoritmul de preț egal), va duce la faptul că vor trebui deschise prea multe vârfuri În următoarele câteva secțiuni, vor fi obținute o serie de rezultate teoretice referitoare la o funcție specială de evaluare, a cărei utilizare duce la descoperirea celui mai mic număr de vârfuri care este compatibil cu garantarea traseului costului minim ALGORITM OPTIM DE CĂUTARE Vom descrie acum o funcție specială de evaluare și vom arăta că utilizarea acesteia maximizează o măsură a eficienței căutării și, în același timp, garantează descoperirea unei căi de cost minim care duce la obiectiv Să definim funcția de cost f astfel încât valoarea lui f(n) pentru orice vârf n să fie suma costului estimat al căii costului minim de la vârful inițial s la vârful n și costul estimat al căii costului minim de la vârful n până la vârful țintă Astfel, f(n) este o estimare a costului căii de cost minim, cu condiția ca această cale să treacă prin nodul n Prin această estimare, vârful listei OPEN, care are cea mai mică valoare a lui f, este considerat a fi se află pe calea costului minim și, prin urmare, următoarea ar trebui să-i fie dezvăluită Pentru a demonstra unele dintre proprietățile acestui estimator, introducem mai întâi o notație Fie funcția A(pi, R;) să dea costul real al căii costului minim între două vârfuri arbitrare pi și u- (Funcția k nu este definită pentru vârfuri între care nu există cale ) Dacă T este mulțimea de vârfuri țintă, atunci costul căii costului minim de la vârful u la țintă este notat h(nt)= min k(nh nj) rij^T (Funcția h nu este definită pentru acele vârfuri n de la care niciunul dintre vârfurile țintă nu este atins ) Vom spune că orice cale de la vârful n până la vârful țintă pentru care este atins /r(n ) este o cale optimă de la vârful spre obiective Va trebui adesea să cunoaștem costul căii optime k(s, n) de la un vârf inițial dat s la un vârf arbitrar n Notația noastră este oarecum simplificată dacă introducem o nouă funcție g definită după cum urmează: g(n) = k (s, n) pentru toate n accesibile din s Algoritm optim de enumerare În continuare, definim o funcție f astfel încât valoarea ei f(n) pentru orice vârf n să fie suma costului real al căii optime de la vârful s la vârful n și costul căii optime de la vârful n la oricare dintre vârfuri țintă Prin urmare, f(") = g(n) + h(n) Cu alte cuvinte, valoarea lui f(n) este costul căii optime, cu condiția să treacă prin nodul n (Rețineți că f(s) - h(s) este costul real al căii optime de la nodul s la obiectiv fără nicio restricție ) Vrem ca funcția noastră de evaluare f să fie funcția de evaluare f Vom presupune că estimarea noastră este dată de expresia н (") = e (n) + /r (") unde e este estimarea pentru g și H este estimarea pentru h Este firesc să alegeți ca £(n) costul căii de la s la n în arborele de enumerare, care se obține după însumarea costurilor arcelor aflate pe calea dată de pointerii mergând de la n înapoi la s (Această cale este calea cu cel mai mic cost de la s la n găsită de algoritm până acum ) Rețineți că din definiție rezultă că g(n) > g(n) Pe următorul simplu ? = lucru de algoritm Luați în considerare '°r* subgraful prezentat în fig ~ Este format din partea superioară inițială - fig Un exemplu de calcul al lui s și al altor trei vârfuri pІУ p ale funcției g și p Figura arată costul poduri de arce și direcțiile acestora Luați în considerare funcționarea algoritmului atunci când iterați peste un astfel de subgraf Pornind de la vârful s, obținem două vârfuri nx și n imediat după el Estimările t(nі) și g(n ) vor fi atunci și, respectiv, La acest pas, g(n ) = + - și g(n ) este redus la + = (deoarece acum a fost găsită o cale mai puțin costisitoare către acest vârf) Valoarea lui b'(ni) rămâne egală cu trei În continuare, avem nevoie de o estimare P(n) pentru /i(n) Aici ne bazăm pe orice informații euristice legate Ch Metode de căutare în spațiul de stare cu sarcina în sine Această informație se poate dovedi a fi similară cu informațiile care au fost utilizate în rezolvarea problemei funcției W(n) în exemplul jocului de opt Vom numi L funcția euristică și o vom analiza mai în detaliu mai târziu Să presupunem că acum folosim funcția de scor f ("") = g ("") + (") • Să numim algoritmul de enumerare ordonată care folosește această funcție de evaluare algoritmul A * Rețineți că: dacă H = , atunci algoritmul A* coincide cu algoritmul de preț egal descris mai sus Mai devreme am făcut afirmația (fără dovezi) că în algoritmul de preț egal este garantată găsirea căii către obiectivul care are costul minim Acum vom arăta că dacă /r este o limită inferioară pentru h, atunci algoritmul A* găsește și calea optimă către obiectiv (Deoarece fi = servește cu siguranță drept limită inferioară pentru h, faptul că algoritmul de preț egal permite găsirea căilor optime va urma ca un caz special al acestui rezultat mai general pentru A* ) ADMISIBILITATEA ALGORITMULUI A* În cazul general, vom numi un algoritm de enumerare admisibil dacă, pentru un graf arbitrar, își încheie munca prin construirea unei căi optime către obiectiv (cu condiția ca o astfel de cale să existe) În această secțiune vom demonstra că dacă fi este o limită inferioară pentru h, atunci A* este admisibil Ideea demonstrației este să ne asigurăm mai întâi că (cu restricția noastră pe fi) înainte de finalizarea algoritmului A* în lista DESCHIS și pe o cale optimă - există un vârf, valoarea lui f pentru care este nu mai mare decât costul real f(s) al modului optim Folosind acest rezultat, vedem că admisibilitatea algoritmului D* rezultă din faptul că vârful din lista OPEN care are valoarea minimă a lui f nu poate fi vârful țintă (la care se termină algoritmul D*) până când nu este găsit vârful țintă pentru care f este egal cu f(s) Astfel, în primul rând demonstrăm lema care afirmă că, dacă funcția euristică fi este o limită inferioară pentru h, atunci înainte ca algoritmul A* să-și termine activitatea, va exista un ') deschis pe orice cale optimă ') Orice vârf al listei DESCHIS va fi numit deschis, iar orice vârf al listei ÎNCHIS va fi numit închis Un vârf neînchis este unul care fie se află în lista DESCHIS, fie nu a fost încă construit în procesul de enumerare Admisibilitatea algoritmului A* un vârf pentru care valoarea lui f nu depășește costul real f(s) al căii optime Lema Daca pentru toti n conditia H(n) "g; h(n), atunci în orice moment înainte ca algoritmul A* să-și termine lucrul, pe orice cale optimă P de la vârful s la obiectiv există un vârf deschis n' pentru care Dovada Să presupunem că calea optimă P este reprezentată printr-o succesiune ordonată (s = , n n , , n , , n ), unde n este vârful țintă Fie n primul vârf deschis din această secvență (Trebuie să existe cel puțin un astfel de vârf, deoarece dacă ID este închis, atunci A* și-a terminat deja munca ) Prin definiția lui f, avem f(n') = g(n')+fi(n') Știm că A* a găsit calea optimă către u', deoarece n' se află pe P și toți predecesorii săi pe P sunt închiși Prin urmare g(n') = g(n') și f("') = §■("') + f("') • Deoarece presupunem că H(n') h(n'), putem scrie sat t(n') M = f(s) Este clar că un vârf situat la o distanță mai mare de M pași față de s nu va fi niciodată deschis, deoarece prin Lema există un vârf deschis n' pe calea optimă astfel încât f(n') f(s) f(s), astfel încât /("') ^f(s) g(n) Mai mult, există o cale optimă P de la $ la n Deoarece g(n) > g(n), această cale nu este găsită de algoritmul A* Dar după Lema există un vârf deschis n' pe calea P cu g(n') = g(n') Dacă n' = n, atunci lema este demonstrată In caz contrar g(n) = g(n') + k (n\ n) = g(n') + k(n', n) Astfel, dacă presupunem că g(n) > g(n), atunci e(n) > g(n') + k(n', n) Adăugând /r(n) la ambele părți ale inegalității scrise, obținem £ (n) + /i (n) > g (nf) + k (n', n) + fi (n) Putem aplica ipoteza de consistență în partea dreaptă a inegalității anterioare și obținem J (n) + fi (n) > g (n') + fi (n'), sau F(") > f(n') în contradicție cu faptul că în algoritmul A* s-a ales un vârf n pentru expansiune când a existat un vârf n', ceea ce demonstrează lema În continuare, trebuie să arătăm că dacă R este limita inferioară pentru h, atunci valoarea lui f pentru vârful închis de algoritmul A*, Ch Metode de căutare în spațiul de stare nu poate fi mai mare decât costul căii optime de la s la vârful țintă Lema Pentru orice vârf n închis de algoritm A*, dacă b este limita inferioară pentru h, atunci f(n) f(s) Dovada Este ușor de obținut din Lema Fie n orice vârf închis de algoritmul A* Dacă n este vârful țintă, atunci avem trivial ț(n) = f(s) Deci, să presupunem că n nu este vârful țintă În plus, vârful n a fost închis în algoritmul A* înainte de a se termina, așa că acum știm (prin Lema ) că există un vârf deschis n' pe calea optimă de la s la obiectiv cu f(n') Dacă n = n ', atunci dovada noastră este completă În caz contrar, știm că n va fi ales pentru expansiune prin A* și nu n', așa că acesta trebuie să fie cazul când f(") f(s) - g(n) Astfel de informații, disponibile pentru algoritmul A, ar putea face posibilă obținerea unei estimări la limita inferioară pentru f(n) = f(s) - g(n) Pe de altă parte, următoarea funcție de evaluare a fost utilizată în algoritmul A*: f(n) = g(n) + A(n) Din Lema știm că Așa știm că e(n) + Prin urmare, oricare ar fi funcția /r utilizată în algoritmul A*, aceasta trebuie să satisfacă inegalitatea A(n) putem găsi cu uşurinţă soluţii în cazuri mult mai dificile ale jocului de opt decât cele considerate mai jos • În fig prezintă arborele rezultat din aplicarea algoritmului de căutare ordonată cu această funcție de evaluare la problema conversiei din stânga a următoarelor configurații în cea dreaptă: la eu în Ca și înainte, valoarea f pentru fiecare vârf este încercuită, iar numerele fără cercuri indică ordinea în care au fost extinse vârfurile S-a dovedit că calea de decizie are o lungime minimă ( pași), deși, deoarece funcția H nu este o limită inferioară pentru h, găsirea căii optime nu a fost garantată Rețineți că o astfel de funcție I conduce la o enumerare direcționată destul de direct către obiectiv Există doar câteva ramuri în lateral și sunt concentrate în apropierea vârfului inițial Orez Un arbore construit prin procesul de iterație ordonată Ch Metode de căutare în spațiul de stare Un alt factor care determină puterea euristică a unui algoritm de enumerare ordonată este cantitatea de efort implicată în calculul /r Cea mai bună funcție /r ar fi o funcție exact aceeași cu h și ar furniza numărul minim absolut de expansiuni de vârf O astfel de funcție /r ar putea fi determinată, de exemplu, ca urmare a unei enumerari exhaustive separate la fiecare vârf, ceea ce, evident, nu ar duce la o reducere a cantității de calcule în ansamblu Uneori este mult mai ușor să calculați o funcție /r care este diferită de limita inferioară pentru A decât una care coincide cu ea În acest caz, puterea euristică a algoritmului poate fi mărită din două motive - atât datorită scăderii numărului total de vârfuri care trebuie extins (cu prețul respingerii admisibilității), cât și datorită scăderii cantității de calcul În unele cazuri, puterea euristică a unei anumite funcții H poate fi crescută pur și simplu prin înmulțirea acesteia cu o constantă pozitivă mai mare decât unu Dacă acest factor este foarte mare, atunci obținem o situație analogă cu condiția £(x) = O astfel de alegere va duce cu siguranță la un algoritm care este inacceptabil, dar totuși capabil să funcționeze satisfăcător Pe baza intuiției, s-ar putea presupune că alegerea lui ^(n) = va duce la o creștere a eficienței enumerarii în cazurile în care este de dorit să se obțină orice cale către scop (neavând neapărat un cost minim) În secțiunea următoare, prezentăm câteva rezultate care contrazic acest tip de intuiție În rezumat, există trei factori importanți care afectează puterea euristică a unui algoritm de căutare ordonată: Costul căii Numărul de vârfuri descoperite în timpul căutării unei căi Cantitatea de calcul necesară pentru a calcula 'valorile funcţiei fi Alegerea funcției adecvate /r ne permite să obținem pentru fiecare problemă compromisul necesar între acești trei factori, ceea ce maximizează puterea euristică a algoritmului ROLUL IMPORTANT AL FUNCȚIEI g În multe probleme, trebuie doar să găsim o cale către vârful țintă, iar costul căii rezultate nu contează (Dar, desigur, ne interesează amploarea dificultăților de enumerare în găsirea unei astfel de căi ) În astfel de cazuri, se pot da motive intuitive atât pentru includerea funcției g în funcția de evaluare, cât și pentru a nu face acest lucru Rolul important al funcției g Argument intuitiv împotriva includerii funcției g în funcția de scor Dacă trebuie să găsim o cale către obiectiv, atunci funcția g poate fi ignorată, deoarece la orice pas al enumerației nu ne pasă de costurile căilor deja construite Pentru noi, doar acele costuri de enumerare care sunt încă necesare înainte de a fi găsit vârful țintă sunt semnificative și, probabil, depind de valorile lui fi pentru nodurile deschise, dar cu siguranță nu depind de valorile £ pentru aceste vârfuri deschise ■În consecință, în astfel de probleme ar trebui să folosim funcția de evaluare f = H Motivul intuitiv pentru includerea funcției G în funcția de estimare Chiar și în cazul în care nu este esențial ca calea găsită să aibă costul minim, funcția g ar trebui inclusă în f pentru a fi sigur că cel puțin o cale va fi găsită în cele din urmă O astfel de încredere trebuie să fie întotdeauna asigurată atunci când H nu este o limită suficient de bună pentru h, deoarece dacă vârfurile cu cel mai mic H sunt întotdeauna deschise, atunci se poate întâmpla ca în procesul nostru de enumerare să fie deschise tot timpul vârfuri false, iar vârful țintă nu va fi atins Includerea funcției g, așa cum ar fi, introduce o anumită componentă a enumerarii exhaustive și garantează că nu există o astfel de parte a graficului pe care procesul de enumerare o ocolește în mod constant Fiecare dintre aceste considerații pare rezonabilă, deși ni se pare că a doua este mai justificată logic Într-o serie de cazuri speciale, a doua considerație poate fi susținută chiar și de o analiză precisă adecvată , Considerăm cazul unui graf infinit sub forma unui arbore m-ary infinit (Un arbore m-ary infinit este un arbore în care fiecare vârf are exact m vârfuri imediat după el ) Acest grafic are un singur vârf țintă care se află la nivelul &-lea Rețineți că obiectivul este accesibil de la orice vârf al acestui grafic particular Un exemplu de astfel de grafic este prezentat în Fig , ; se presupune că costurile marginale sunt unitare Să presupunem că folosim următoarea funcție /r pentru a itera peste acest grafic: /r(n) = A(n) + E pentru vârfurile n pe calea cea mai scurtă, /r(n) = h(n) - E pentru vârfurile n în afara căii celei mai scurte Ch Metode de căutare în spațiul de stare unde E este o eroare întreagă Adică, funcția noastră H conține întotdeauna o eroare, a cărei valoare este egală cu un număr întreg Er) În plus, semnul acestei erori este ales astfel încât să provoace cea mai mare dificultate După ce am analizat cel mai rău caz Orez Un grafic care ilustrează un copac m-ary infinit tea, vom arăta că pentru o astfel de funcție H, enumerarea cu funcția f = g + fî este mai eficientă decât enumerarea cu funcția f = fi, cu excepția cazului în care E > Trebuie să comparăm următoarele două cazuri: Cazul f = g + /z Fie Ns+h numărul de vârfuri care au fost deschise înainte de a atinge obiectivul Aici ni se cere să extindem un vârf dacă acesta se află în unitățile E ale oricărui vârf de pe calea cea mai scurtă (În spiritul celui mai rău caz pe care îl luăm în considerare, vom alege întotdeauna cea mai proastă dintre posibilități dacă numărul de vârfuri este E ) Se poate observa atunci că Ng+fl = k{l +(m - ) (numărul de vârfuri dintr-un arbore m-ary adâncimea (F - ))} = k + (ng - ) ] J = kmE ') Rețineți că funcția R nu oferă o limită inferioară pentru L în acest caz Utilizarea altor euristici О Cazul f = I Fie Nh numărul de vârfuri care au fost deschise înainte de atingerea scopului Aici ni se cere să dezvăluim un vârf dacă este situat - în E - unități de vârf pe calea cea mai scurtă (Vârfurile înșelător de promițătoare în acest caz fac ca procesul de enumerare să se deplaseze la o distanță mai mare de la calea cea mai scurtă la obiectiv ) Deci, pentru E avem { + (m - ) (numărul de vârfuri dintr-un arbore m-ary {G £ - , + (w - ) j -JJ - (Se poate arăta separat că Nh = k pentru E = ) Vedem că Nh este mai mare decât Ng+h pentru E > , ceea ce înseamnă că (pentru graficul nostru) pentru o enumerare eficientă este necesar să includem funcția g în funcția de evaluare Raportul Ng+h/Nh este independent de k și este dat pur și simplu de = pentru £> Deși această diferență de eficiență poate fi mult mai mică în problemele din viața reală, studiul nostru din cel mai rău caz arată că intuiția includerii funcției £ în funcția de scorare are o valoare tangibilă UTILIZAREA ALTE EURISTICI Iterație pe etape Până acum, în acest capitol, am discutat despre faptul că utilizarea informațiilor euristice poate reduce semnificativ cantitatea de căutare necesară pentru a găsi o cale acceptabilă Prin urmare, utilizarea sa permite și enumerarea pe grafice mult mai mari Cu toate acestea, pot apărea cazuri când memoria de care dispunem este epuizată înainte de a găsi o cale satisfăcătoare În aceste cazuri, poate fi util să nu se abandoneze complet continuarea enumerarii, ci să se "taie" o parte din ramurile arborelui construite până în acest punct în procesul de enumerare, eliberând astfel spațiul de memorie necesar pentru aprofundare enumerarea Acest proces de enumerare poate fi realizat în etape, care sunt separate unele de altele prin operațiuni de tăiere a arborilor necesare pentru a elibera memoria La sfârșitul fiecărei etape, are loc un subset de vârfuri deschise, Ch Metode de căutare în spațiul de stare de exemplu, vârfurile cu cele mai mici valori D Cele mai bune căi către aceste vârfuri sunt reținute, iar restul arborelui este aruncat Apoi enumerarea începe din nou, deja de la aceste "cele mai bune" vârfuri deschise Acest proces continuă până când este găsit vârful țintă sau toate resursele sunt epuizate Este clar că, chiar dacă algoritmul A* este utilizat în fiecare etapă, atunci, deși întregul proces se termină cu construirea unei căi, cu toate acestea, acum nu avem nicio garanție că această cale va fi optimă Limitarea numărului de vârfuri copil Mai devreme în acest capitol, sa observat că o altă modalitate de a reduce cantitatea de iterație este utilizarea unui operator Γ mai informat care să nu genereze prea multe vârfuri ulterioare inutile În limită, un operator "complet informat" Γ ar genera doar vârfuri situate pe calea optimă, eliminând astfel complet necesitatea enumerarii Unul dintre trucurile care pot reduce cantitatea necesară de enumerare este să aruncați aproape toate nodurile copil imediat după deschiderea unui vârf, lăsând doar un număr mic dintre ele cu cele mai mici valori ale funcției f Desigur, vârfurile aruncate se pot dovedi a fi situate pe cele mai bune (și chiar numai pe cele mai bune) căi, așa că numai experimentul poate determina adecvarea unei astfel de metode de tăiere a graficului pentru probleme specifice Există, de asemenea, probleme de enumerare în care toate vârfurile imediat care urmează cuiva pot fi enumerate și valorile lui /r pentru ele pot fi calculate chiar înainte de construirea descrierilor de stări corespunzătoare într-o formă explicită Mai mult, poate fi util să amânăm obținerea unei descrieri a stării asociate cu un anumit nod până în momentul în care acesta este el însuși dezvăluit Apoi, în procesul nostru, nu vor fi niciodată construite vârfuri copil inutile, care în viitor în timpul procesului ar rămâne nedescoperite Construcția alternativă a nodurilor copil Când vârfurile imediat ce urmează cuiva sunt calculate folosind operatori de spațiu de stare, este evident că aceste vârfuri ulterioare pot fi construite separat și independent unul de celălalt În plus, există cazuri în care aplicarea tuturor operatorilor aplicabili ar fi foarte risipitoare în ceea ce privește costurile de calcul După cum sa menționat mai sus, un operator mai informat Г Criterii pentru calitatea muncii metodelor de enumerare Aș evidenția câțiva operatori cei mai promițători și aș construi L -uri numai pentru acele vârfuri ulterioare care apar ca urmare a aplicării lor O abordare mai flexibilă este aceea de a permite mai întâi aplicarea celui mai promițător operator (care va duce la un vârf ulterior), lăsând posibilitatea în procesul de enumerare de a construi alte vârfuri imediat după acesta Pentru a utiliza această idee împreună cu funcțiile de evaluare pentru ordonarea vârfurilor, algoritmul de enumerare ordonată ar trebui modificat corespunzător CRITERII DE PERFORMANȚĂ ALE METODELOR REZUMAT Puterea euristică a unei anumite metode de forță brută depinde în mare măsură de trăsăturile specifice caracteristice unei probleme date, iar determinarea acestei puteri este mai mult o chestiune de experiență decât de calcul Cu toate acestea, există câteva criterii de performanță care pot fi calculate și, deși aceste criterii nu oferă o estimare exhaustivă a puterii euristice, ele sunt utile atunci când se compară diferite metode de enumerare Unul dintre aceste criterii se numește scop Scopul enumerarii P vă permite să aflați în ce măsură enumerarea merge în direcția scopului, și nu în direcții nedorite Este pur și simplu definit ca unde L este lungimea căii găsite către obiectiv și T este numărul total de vârfuri construite în timpul enumerarii (inclusiv vârful țintă, dar excluzând vârful inițial) De exemplu, dacă operatorul Г, cu ajutorul căruia sunt construite nodurile ulterioare, este atât de precis încât sunt construite numai vârfurile care se află pe calea către obiectiv, atunci pentru el valoarea lui P atinge maximul egal cu Căutare oarbă se caracterizează prin valori mici ale lui P Astfel, intenția arată modul în care arborele, construit în timpul enumerarii, este alungit și nu stufos "Valorile valorilor scopului pentru unele exemple de enumerare utilizate în acest capitol sunt date în tabel Valoarea scopului enumerării depinde atât de dificultatea problemei pentru care se realizează această enumerare, cât și de eficiența metodei de enumerare Pentru o anumită metodă de enumerare, orientarea către obiectiv poate fi mare dacă calea de decizie optimă este scurtă și mică dacă această cale se dovedește a fi Ch Metode de căutare în spațiul de stare lung (De regulă, creșterea lungimii căii de soluție L face ca T să crească și mai rapid ) Tabelul Intenție și factor de ramificare eficient pentru diverse exemple Game of Eight Bust Game of Eight Game of Eight + P(n) + S(e) Intenție P , , , ■Factor de ramificare eficient B , , , Un alt criteriu, factorul efectiv de ramificare B, depinde mult mai puțin de lungimea căii optime de decizie Definiția sa se bazează pe ideea că un arbore are o adâncime egală cu lungimea acestui drum și un număr total de vârfuri egal cu numărul de vârfuri construite în iterație, iar fiecare vârf al acestui arbore are exact B vârfuri copii Astfel, B este legat de lungimea traseului L și de numărul total de vârfuri T construite prin relații B + B + +BL = T Și -g~~î'(BL- ) = T Valoarea lui B nu poate fi scrisă ca o funcție explicită a lui L și T, dar în fig Figura este o diagramă care arată dependența lui B de T pentru diferite valori ale lui L O valoare a lui B apropiată de unitate corespunde unei enumerații care este foarte precis direcționată direct către țintă și se ramifică foarte puțin în alte direcții Pe de altă parte, un grafic de enumerare stufos este caracterizat de o valoare ridicată a lui B Valorile lui B pentru exemplele noastre de enumerare au fost calculate folosind diagrama prezentată în fig și sunt date împreună cu valorile scopului din tabel Scopul este legat de B și lungimea căii prin formula P = L(B-{)/B(Bl- ) Pe fig arată modificarea scopului cu lungimea căii pentru diferite valori ale lui B În măsura în care B depinde puțin de lungimea căii, această valoare poate fi utilizată pentru a prezice câte vârfuri ar fi construite prin iterare pe o lungime dată De exemplu, din tabel se poate observa că atunci când / = g' + P + S pentru un joc de opt, se obține valoarea lui B egală cu , Sa incercam " Ch Metode de căutare în spațiul de stare acum află câte vârfuri ar trebui construite folosind aceeași funcție f, rezolvând o problemă mai dificilă în jocul celor opt, necesitând, să zicem, de pași Din Orez Dependența lui P de L pentru diferite valori orez În Figura , vedem că o problemă cu treizeci de pași, presupunând că factorul de ramură rămâne neschimbat, ar necesita aproximativ de vârfuri pentru a fi construite (Această estimare, de altfel, nu contrazice rezultatele experimentale ale lui Doran și Michi ( ), care acoperă mai multe exemple de probleme de acest tip ) NOTE BIBLIOGRAFICE SI ISTORICE Algoritmi pentru găsirea celei mai scurte căi Algoritmii pentru găsirea celei mai scurte căi (sau a căii cu cel mai mic cost) între două vârfuri de graf sunt de mare interes pentru o gamă largă de discipline Procedura, pe care o numim metoda prețului egal, a fost descrisă pentru prima dată de Dijkstra ( ) A fost propusă și o metodă similară de căutare exhaustivă Note bibliografice și istorice Moore ( ) Algoritmii de programare dinamică ai lui Wellman sunt, în esență, metode de forță brută Pentru o prezentare detaliată a programării dinamice, vezi Wellman și Dreyfus ( ) Procedura de iterare la o anumită adâncime este adesea denumită programare back-track; este descris de Golomb şi Bomert ( ) Stuart Dreyfuss ( ) oferă o imagine de ansamblu detaliată a acestor și a altor metode de căutare grafică Căutare euristică Problema utilizării informațiilor euristice pentru creșterea eficienței enumerării a fost luată în considerare atât în domeniul inteligenței artificiale, cât și în cercetarea operațională Probabil cea mai cunoscută aplicație a funcțiilor de evaluare euristică a fost în programele de joc, în special în programul lui Samuel ( , ) pentru jocul de dame Invocarea estimatorilor pentru enumerarea directă a graficului a fost propusă de Doran și Michie ( ) și explorată în continuare de Doran ( ) și Michie și Ross ( ) Exemplele noastre de joc de opt se bazează pe cele ale lui Doran și Michie O teorie generală privind utilizarea estimatorilor pentru a enumera a fost prezentată într-o lucrare a lui Hart, Nilson și Raphael ( ); descrierea noastră a algoritmului psxsk ordonat și a proprietăților acestuia se bazează pe această lucrare În ramura și metodele legate de cercetare operațională, găsim și utilizarea funcțiilor de evaluare pentru a ghida căutarea către scop Descrierea lor poate fi găsită într-un articol de recenzie al lui Lawler și Wood ( ) Metoda de ramificare și legată propusă de Shapiro ( ) pentru problema vânzătorului ambulant poate fi interpretată și ca o aplicare directă a algoritmului A* Analiza noastră care susține importanța includerii funcției g (în același mod ca și funcția /r) în funcția de evaluare este preluată din disertația lui Pohl ( ) (Vezi și Pohl, ) Pohl ( ) a luat în considerare și problema construirii unei enumerații atât de la vârful inițial, cât și de la cel țintă Un interes deosebit este aici tratarea sa detaliată a criteriilor de oprire mai complexe necesare în enumerarea bidirecțională Întreruperea procesului de enumerare prin etapele de tăiere a arborilor (pentru a șterge memoria necesară) a fost investigată de Doran și Michi ( ) și Doran ( ) Criteriu de performanta Doran și Michi ( ) au propus scopul ca măsură a eficienței unei căutări date Slagel și Dixon ) au propus o măsură diferită, pe care au numit-o "profundă • Ch Metode de căutare în spațiul de stare atitudine " "Bramificarea noastră eficientă" a fost inspirată din aceste două măsuri de eficiență introduse anterior Sarcini Luați în considerare reprezentarea spațiului de stat a problemei vânzătorului ambulant descrisă în Sec Sugerați cel puțin două funcții H (H și ) care sunt limite inferioare pentru h Care dintre aceste funcții crezi că va avea ca rezultat o enumerare mai eficientă? Aplicați algoritmul A* cu aceste funcții la problema vânzătorului care călătorește cu orașe prezentată în Fig Pe fig Utilizați o abordare a spațiului de stări pentru a găsi o cale de lungime maximă care începe la A, trece prin orice alt oraș cel mult o dată și se întoarce la A Alegeți o reprezentare spațiu de stare și desenați partea spațiului de stare a graficului cu vârfurile și costurile arcelor, marcate cu semne corespunzătoare, și indicați în această coloană calea optimă de la vârful inițial la vârful țintă Luați în considerare posibilele merite ale următoarei strategii de iterație în spațiul de stare: prin orice metodă convenabilă, obțineți o cale către obiectiv și costul său C Acest cost nu este neapărat minim, dar oferă o limită superioară a costului minim Acum folosiți algoritmul A* cu o funcție H care garantează admisibilitatea, i aruncați imediat acele vârfuri deschise obținute pentru care valorile lui f pentru care sunt mai mari decât C Este admisibilă această strategie modificată? Faptul că unele dintre nodurile deschise pot fi aruncate în acest algoritm înseamnă că numărul de vârfuri care vor fi deschise se poate dovedi a fi mai mic? Reduce acest lucru cerințele generale de memorie? Să presupunem că H este o limită inferioară pentru h Demonstrați că dacă algoritmul A* deschide vreodată un vârf pentru care f(n) = f(s), atunci fie vârful n a fost pe calea optimă, fie imediat înainte de deschiderea în lista OPEN și a existat un astfel de vârf m pe cale optimă , că /(") = f(m) = f(s) Fie "i, " , • • •, Pk o succesiune de versuri rezolvate prin algoritmul A* Demonstrați că dacă H satisface ipoteza de consistență (Sec ), atunci f (Pi)/(Pi+i) pentru orice i ) Acest grafic a fost propus de J McCarthy (comunicare privată) Ch Reprezentări care permit reducerea problemelor la subsarcini când discul C (cel mai mare) este pe pilonul i, discul B este pe pionul /, iar discul A (cel mai mic) este pe pionul k Dacă există mai mult de un disc pe același pilon, atunci se presupune întotdeauna că cel mai mare este în partea de jos, etc Orez Grafic pentru problema piramidei configurațiile reprezentate de unul dintre vârfurile perechii se vor schimba în configurația reprezentată de celălalt vârf De exemplu, un arc care merge de la ( ) la ( ) înseamnă că ( ) poate fi schimbat în ( ) prin deplasarea discului B de la pilonul la cuiul Această acțiune este reflectată în inscripția "Shift (B, ) , ) " la aceasta, arc (Calea marcată cu linii groase în acest grafic reprezintă soluția problemei ) Problema piramidei poate fi rezolvată și printr-o metodă simplă de reducere a problemei la subprobleme Una dintre modalitățile de a reduce problema inițială despre piramida prezentată în Fig , în total Un exemplu de reducere a unei sarcini la subsarcini Complexitatea problemelor mai simple este legată de următorul lanț de raționament: Pentru a transfera toate discurile pe pilonul , trebuie, bineînțeles, să transferăm discul C pe acest pion, iar în momentul imediat premergător transferului discului C pe pilonul , acesta din urmă trebuie să fie liber Acum, având în vedere configurația inițială, vedem că discul C nu poate fi mutat nicăieri până când discurile A și B nu sunt îndepărtate din acest cuib În plus, este mai bine să nu așezați discurile A și B pe suportul , de atunci avem că nu va exista nicio modalitate de a pune discul C Deci, mai întâi de toate, trebuie să transferăm discurile A și B la chela Apoi putem face pasul nostru principal, deplasând discul C de la peg D la și trecem la rezolvarea problemei rămase Vedem că aceste considerații ne permit să reducem problema inițială la următoarele trei probleme: Problemă cu două discuri despre mutarea discurilor A și B la chela : I g ( ) ( ) Problemă cu un disc în legătură cu mutarea discului C la chela : ( ) ( ) Problemă cu două discuri despre mutarea discurilor A și B la chela : ( )' ( W) Elementar Elementar' Elementar Elementar Elementar Elementar Orez Un grafic al subsarcinilor care reduce problema piramidei la un set de probleme elementare într-un singur pas Descrierea sarcinilor Fiecare dintre aceste trei probleme rezultate este mai mică și, prin urmare, ar trebui să fie mai ușoară decât problema inițială Într-adevăr, problema poate fi considerată elementară, deoarece soluția ei constă dintr-o singură mișcare Folosind un lanț similar de raționament, problemele și pot fi, de asemenea, reduse la cele elementare, așa cum se arată schematic în Fig (Exact aceeași schemă de reducere a unei sarcini la un set de subsarcini poate fi aplicată și în cazul în care configurația inițială conține un număr arbitrar de discuri ) Structura graficului fig se numește "ȘI/SAU" al graficului (sau al graficului subsarcinilor); este utilă pentru ilustrarea soluţiilor obţinute prin reducerea unei probleme la subprobleme În acest capitol și în următorul capitol, vom examina în detaliu diferitele aplicații ale reducerii sarcinilor la subsarcini Metodele de reducere a unei probleme la subprobleme au fost aplicate la o gamă largă de probleme, inclusiv problema obținerii unei expresii care ar fi o integrală a unei anumite funcții și problema demonstrării teoremelor de planimetrie De asemenea, vom vedea că aceste metode sunt complet analoge cu cele folosite pentru a calcula cea mai bună mișcare următoare în jocuri precum damele sau șahul DESCRIEREA SARCINILOR Abordarea subsarcinii folosește operatori care transformă descrierile sarcinilor în descrieri ale subsarcinilor Există multe forme de descrieri de probleme Listele, arborii, șirurile de caractere, vectorii, matricele și alte forme pot fi folosite din nou în acest scop În problema piramidei, descrierea subproblemelor se poate face sub forma unei liste care să conţină două liste Astfel, descrierea problemei [( ), ( )] înseamnă: "Transformă locația ( ) în locație ( )" Este adesea convenabil să descriem problema în termeni de elemente de reprezentare a spațiului de stare Noi am văzut că orice problemă de căutare în spațiul de stare poate fi reprezentată ca un set de trei componente: Setul S de stări inițiale Mulțimea F de operatori care mapează descrierile de stare în descrieri de stare Setați G de stări țintă Apoi triplul (S, F, G) definește problema și poate fi folosit ca descriere a problemei În problema piramidei, am folosit această notație, deși, deoarece mulțimea F de operatori din spațiul stărilor s-a presupus a fi aceeași pentru toate problemele, ea nu a fost prezentă în mod explicit în descrierile problemei S Ch Vizualizări care permit ca sarcinile să fie reduse la subsarcini După ce sarcinile și subsarcinile sunt descrise ca triple (S, F, G), este firesc să considerăm aceste subsarcini ca sarcini de găsire a unei căi între anumite stări de reper în spațiul de stări De exemplu, în problema piramidei, subsarcinile [( ) φ ( )], [( ) φ ( )] și [( ) φ ( )] definesc astfel de stări de reper ( ) și ( ) ) care au proprietatea că prin ele va trece și calea decisivă finală Faptul că abordarea subsarcinii folosește noțiunile de stări, operatori și ținte pentru a descrie subsarcinile nu înseamnă în sine că această abordare și abordarea spațiului de stare sunt în esență aceleași De fapt, așa cum am observat deja, iterația în spațiul de stare este un caz trivial de reducere a unei probleme la subsarcini; din acest motiv, abordarea asociată cu reducerea problemei la un set de subsarcini poate fi considerată ca o metodă de rezolvare mai generală decât enumerarea secvenţială în spaţiul de stări De asemenea, s-ar putea gândi la abordarea problemă-la-subproblemă pur și simplu ca o modalitate de a enumera pașii individuali de a găsi subcăi între presupusele repere ale spațiului de stare și de a gestiona procesul de asamblare a subcăilor în soluții complete OPERATORI PENTRU REDUCEREA O PROBLEME LA SUB-SARCINI Operatorul de reducere a unei sarcini la subsarcini transformă o descriere a sarcinii într-un set de descrieri de sarcini rezultate sau secundare Această transformare este de așa natură încât rezolvarea tuturor problemelor copilului oferă o soluție la problema părintelui inițial Când setul de sarcini copil este format dintr-un element, avem cel mai simplu caz de înlocuire a unei sarcini cu alta, echivalentă cu aceasta Pentru o anumită descriere a problemei, pot exista mulți operatori de reducere, fiecare dintre care este aplicabil Aplicarea fiecărui astfel de operator generează seturi alternative de subsarcini Unele dintre aceste subprobleme se pot dovedi a fi de nerezolvat, așa că va trebui să încercăm mai mulți operatori pentru a construi o astfel de mulțime, ai căror membri toți sunt decidabili Astfel, sarcina enumerarii apare din nou O clasă de probleme se ocupă de a demonstra *) că anumite afirmații sunt adevărate Fie S o afirmație, adevărată ') În acest capitol, discuția noastră despre dovezi va fi destul de informală În capitolele următoare, subiectul dovezii și rolul acesteia în rezolvarea problemelor vor fi luate în considerare mai strict Descrieri ale sarcinilor elementare a cărui validitate dorim să o dovedim, â T este ansamblul de premise care se presupune că sunt adevărate Apoi sub S | T (a se citi "S pentru un T dat"), vom înțelege problema demonstrării enunțului S, pe baza premiselor lui T Schema generală de reducere a problemelor de acest tip la subprobleme este introducerea de noi premise în problema inițială , iar apoi formulați probleme suplimentare pentru a demonstra aceste noi premise Astfel, atunci când reducem problema S|T, adăugăm, să zicem, N premise și obținem următorul set de probleme rezultate: SI G, X , , XN Xt\T, X , XN Xn\T unde Xt, X , , XN sunt n mesaje suplimentare Adesea, acest operator de reducere a problemelor este aplicat astfel încât să fie adăugată o singură premisă la un moment dat Apoi S|T se reduce la mulțimea S|X, T și X|T Simbolurile premiselor Xi, , XN ar putea fi considerate variabile care iau valori dintr-un anumit set de premise Atunci fiecare valoare posibilă a acestor variabile ar corespunde aplicării unui operator separat de reducere a sarcinilor Aceste variabile pot primi imediat semnificații specifice ca premise specifice (eventual conținând variabile noi), dar în schimb pot fi lăsate ca variabile, ținând cont că li se pot atribui semnificații specifice în procesul de reducere ulterioară Mai târziu vom lua în considerare câteva dintre abordările propuse pentru alegerea unor valori specifice pentru sediu Adesea va trebui să alegem mai mult de un set de premise ca puncte de date, astfel încât dovada noastră să poată reveni și mergi in alte directii alternative DESCRIEREA SARCINILOR ELEMENTALE Scopul final al oricărui fel de reducere a unei probleme la subprobleme este obținerea unor probleme elementare ale căror soluții sunt evidente Aceste probleme pot fi atât probleme care pot fi rezolvate într-un singur pas de enumerare în spațiul de stat, cât și alte probleme mai complexe care au soluții cunoscute nouă Pe lângă faptul că joacă un rol evident în oprirea procesului de enumerare, aceste sarcini elementare sunt uneori folosite pentru a restricționa procesul de construire a unor seturi alternative de probleme rezultate în timpul procesului de reducere dec cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini sarcini Această constrângere apare deoarece una sau mai multe dintre aceste probleme rezultate se întâmplă să aparțină unei anumite subclase de probleme elementare GRAFICE , B} Dacă presupunem că vârfurile A și A joacă rolul descrierilor sarcinilor, atunci vedem că sarcina A este redusă la subsarcini alternative unice N, M sau F Din acest motiv, vârfurile etichetate N, M și F sunt numite "SAU " vârfuri coloane "IIOR" Problema N se reduce la un set de subprobleme B și C, ambele trebuie rezolvate pentru ca problema /V să fie rezolvată Din acest motiv, vârfurile etichetate B și C sunt numite vârfuri "I" Vârfurile de tip "I" se disting printr-un marcaj făcut pe arcele care merg spre ele Structuri precum cea prezentată în fig sunt numite grafice "ȘI/SAU" Dacă un vârf AND/SAU al unui graf are vârfuri imediat după el, atunci fie toate sunt vârfuri "SAU", fie toate sunt vârfuri "ȘI" (Dacă un vârf are exact un vârf imediat după el, atunci poate fi considerat atât un vârf "ȘI", cât și un vârf "SAU" ) Rețineți că în cazul special când nu există vârfuri de tip "ȘI" deloc, obținem un grafic obișnuit de tipul care a apărut în timpul enumerarii în spațiul de stări Dar datorită prezenței vârfurilor de tip "ȘI" în graficele "ȘI/SAU", aceste structuri diferă semnificativ de structurile grafice obișnuite Ei au nevoie de propriile tehnici de căutare specializate, care este principalul motiv pentru care facem distincție între cele două abordări ale rezolvării problemelor Când descriem graficele "ȘI/SAU", vom continua să folosim termeni precum vârfuri părinte, vârfuri imediat următoare unuia dat (copii), un arc care leagă două vârfuri etc , dându-le un sens evident În limbajul graficelor "ȘI/SAU", utilizarea unui singur operator pentru reducerea unei sarcini la subsarcini la o anumită descriere a sarcinii va însemna, de obicei, că, la rândul său, va fi construit mai întâi un vârf intermediar "SAU" și apoi vârfurile "ȘI" imediat următoare (Excepția este cazul când setul de subsarcini este format dintr-un element În acest caz, se formează exact un vârf, și anume vârful "SAU" ) Astfel, o structură adecvată care modelează metoda de împărțire a unei sarcini în subsarcini este un grafic AND/OR Unul dintre vârfurile acestui grafic, numit vârf inițial, corespunde descrierii problemei inițiale Acele vârfuri ale graficului care corespund descrierilor sarcinilor elementare se numesc vârfuri finale Scopul procesului de căutare efectuat în coloana "ȘI/SAU" este de a arăta că nodul inițial este rezolvabil Definiția generală a solvabilității unui vârf într-un grafic AND/OR poate fi formulată recursiv după cum urmează: Vârfurile finale sunt rezolvabile (deoarece corespund unor probleme elementare) Dacă la un vârf care nu este vârful final imediat următor s-a dovedit a fi vârfuri A* Ch Vizualizări care permit ca sarcinile să fie reduse la subsarcini "SAU", atunci este decidabil dacă și numai dacă cel puțin unul dintre aceste vârfuri este decidabil Dacă un vârf care nu este vârful final imediat următor sa dovedit a fi un vârf "ȘI", atunci este decidabil dacă și numai dacă fiecare dintre aceste vârfuri este decidabil Apoi, graficul de decizie este definit ca un subgraf de vârfuri decidabile care arată (conform definiției de mai sus) că vârful inițial este decidabil V Orez Câteva exemple de grafice AND/OR și grafice de decizie Pentru graficul (b) există mai multe soluții Pe fig prezintă exemple de grafice "ȘI/SAU" Vârfurile finale sunt marcate cu litera t, vârfurile rezolvabile sunt afișate în cercuri negre, iar graficele decisive sunt marcate cu linii groase Dacă un vârf "ȘI/SAU" al graficului, care nu este vârful final, nu are deloc vârfuri după el, atunci spunem că un astfel de vârf este de nerezolvat Apariția unor astfel de vârfuri nerezolvabile poate însemna că alte vârfuri ale graficului (și chiar vârful inițial) pot să nu fie Reprezentare folosind programe nedeterministe' rezolvabil Definiția generală a unui vârf nesolubil este dată recursiv după cum urmează: Vârfurile care nu sunt finale și nu au vârfuri care le urmează sunt de nerezolvat Dacă la un vârf care nu este vârful final imediat următor s-a dovedit a fi vârfuri "SAU", atunci este de nerezolvat dacă și numai dacă fiecare dintre aceste vârfuri este de nerezolvat Dacă un vârf care nu este vârful final imediat următor sa dovedit a fi un vârf "ȘI", atunci este de nerezolvat dacă și numai dacă cel puțin unul dintre aceste vârfuri "ȘI" este de nerezolvat Pe fig , vârfurile nerezolvabile sunt marcate cu cercuri neumplute Arată în fig Coloanele "ȘI/SAU" sunt date în mod explicit La fel ca în cazul rezolvării problemelor în spațiul stărilor, rareori se întâmplă ca graficul pe care urmează să fie efectuată enumerarea să fie dat în mod explicit De regulă, un astfel de grafic este definit implicit prin descrierea problemei inițiale și a operatorilor de reducere a problemei Este convenabil să se introducă un operator Γ pentru construirea nodurilor imediat următoare (copil), care, atunci când este aplicat la o descriere a unei probleme, generează toate seturile de descrieri ale problemelor care decurg din aceasta (Aplicarea operatorului Г înseamnă aplicarea tuturor operatorilor aplicabili pentru reducerea problemei la subsarcini ) Astfel, în cazul fig , aplicarea operatorului G la algoritmul A formează întreaga structură a graficului "ȘI/SAU", care este prezentată în figură Procesul de rezolvare a problemei constă apoi în construirea unei părți suficiente a acestui graf "ȘI/SAU", din care s-ar vedea că vârful inițial este rezolvabil Vom amâna la capitolul următor o discuție despre metodele eficiente de căutare GRAFICE DE REPREZENTARE "ȘI/SAU" FOLOSIND PROGRAME NEDETERMINISTICE ) Putem introduce câteva elemente suplimentare ale programelor nedeterministe astfel încât aceste programe să poată fi folosite pentru a reprezenta procesul de construire a unui grafic "ȘI/SAU" Prin analogie cu operatorul de atribuire SELECT (în care variabila program este luată egală cu orice element al unui set), putem defini operatorul de atribuire ALL În aceasta din urmă, variabila program este luată egală cu toate elementele unora ') La prima lectură, această secțiune poate fi omisă Cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini seturi (Imaginați-vă că evaluarea după instrucțiunea ALL se ramifică în multe procese paralele fictive, fiecare dintre ele ia propria sa valoare ca valoare a variabilei programului ) Orez Un program nedeterminist care determină graficul "ȘI/SAU" PREZUMERE: Variabila programului y (luând valori din zona de descriere a sarcinii) se presupune a fi egală cu structura datelor de intrare, x, care descrie sarcina ALEGEREA: Se presupune că valoarea variabilei programului Y (luând valori în zona seturilor de descrieri de sarcini) este egală cu un element al setului Г (y) de seturi de vârfuri copil pentru valoarea anterioară a y ALL: Noua valoare a lui y este luată egală cu toate elementele mulțimii Y Pe fig Figura este o diagramă bloc a unui program nedeterminist care definește un grafic "ȘI/SAU" Pentru simplitate, condițiile de terminație sunt omise aici, dar ar consta în verificări destul de evidente dacă vârfurile sunt decidabile sau indecidabile În general, operatorul ALL este notat în diagrame de flux după cum urmează: eu y - TOATE (G (i, y)} eu Structura de date x este intrarea în acest program, structura de date y este o variabilă de program, iar funcția F este o funcție care mapează produsul direct al intervalelor lui x și y la un subset al intervalului lui y Din nou, vom folosi simbolul {E} pentru a desemna acest submult; operațiunea y-"-ALL {E} face Reprezentarea cu programe nedeterministe" noile valori ale variabilei programului y egale cu toți membrii mulțimii {F} Introducem și notația A-branch Aceasta este o ramificare în n direcții, care utilizează n predicate Pi(x, y), Pp(x, y) Aceste predicate sunt fie T (adevărat), fie F (fals) în regiunea care este produsul direct al regiunilor lui x și y (Din nou, x este structura datelor de intrare și y este o variabilă de program ) Valoarea a cel puțin unuia dintre aceste predicate trebuie să fie T Fiecare predicat corespunde unei ramuri, iar toate acele ramuri ale căror predicate corespunzătoare au valori T sunt selectate procesoare paralele care încep să lucreze pe fiecare dintre ramurile selectate ) Pe diagramele bloc, ramura L este prezentată după cum urmează: Din nou, ramurile deterministe obișnuite sunt cazuri speciale de ramificare A În mod similar, atunci când valoarea funcției Zr(x, y) este un element, operatorii SELECT, ALL și determiniști obișnuiți sunt aceiași Într-o implementare particulară a unui program nedeterminist, o alegere definită este făcută în ramurile V și instrucțiunile SELECT, iar toate alegerile posibile sunt făcute în ramurile A și ALL instrucțiunile Setul tuturor implementărilor concrete posibile definește un arbore AND/OR Această implementare conține multe căi (ramificare pe ramuri A și TOȚI operatorii) Execuția sa se încheie dacă fiecare dintre căile sale se termină Dacă există cel puțin o implementare de terminare pentru orice intrare, atunci se spune că programul este bine definit Utilizarea tuturor acestor elemente nedeterministe (și deterministe) face posibilă utilizarea programelor nedeterministe pentru a descrie sarcini Ca exemplu, luați în considerare problema celor opt regine În această problemă, este necesar să plasați opt regine pe o tablă de șah obișnuită, astfel încât niciuna dintre ele să nu fie atacată de alte regine Diagrama bloc nedeterministă a programului pentru această sarcină este prezentată în fig În această diagramă bloc, rt și reprezintă cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini coordonatele reginei i-a pe orizontală și respectiv pe verticală* Orez Un program nedeterminist pentru o problemă la opt matci, evident Predicatul "bătăi ((n, Cj), (g, Cj))" are valoarea T numai dacă i-a regina cu coordonate (r, -, Ci) poate învinge i-a regina cu coordonate (r , , Cj) Exemple de reducere a unei sarcini la un set de subsarcini EXEMPLE DE REDUCERE A PROBLEMELOR LA UN SET DE SUB-SARCINI Problemă de integrare simbolică Într-o problemă de integrare simbolică, dorim să avem un proces automat care să ia ca intrare orice integrală nedefinită, să spunem J xsin xdx, și să scoată răspunsul: (l/ )sin x - - (l/ x)cos x Vom presupune că avem la dispoziție un tabel cu astfel de integrale simple ca Atunci orice problemă de integrare simbolică poate fi reprezentată ca o problemă de transformare a unei integrale date în expresii care conțin doar integrale tabulare Pentru simplitate, vom descrie problema integrării funcției (x) în raport cu k prin expresia JI(x)dx Descrierile problemelor elementare sunt date pur și simplu prin integrale tabelare Vedem că fiecare dintre formule este de fapt o schemă care definește un set infinit de sarcini elementare Membrii acestei mulțimi se obțin prin substituirea expresiilor pentru variabilele conținute în aceste formule Pentru a determina dacă o integrală dată este un exemplu de formulă elementară, este necesar să se aplice operatorul de reducere, care caută acele substituții după care integrala și formula coincid Operatorii pentru reducerea unei probleme la subprobleme se pot baza pe regula integrării pe părți, pe regula integrării sumei funcțiilor și pe alte reguli de transformare, cum ar fi reguli care conțin substituții algebrice și trigonometrice Regula integrării pe părți are forma țudv - uțdv - țv du Putem folosi această regulă pentru a justifica următoarea reducere a unei sarcini la subsarcini: cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini Rețineți că această reducere înseamnă doar că problema J și dv pot fi rezolvate dacă putem rezolva problemele J dv și J v du Relația J și dv = și ț dv - J v du poate fi folosită în continuare pentru a construi o soluție reală Dacă există mai multe modalități posibile de împărțire a integrantului original în părți corespunzătoare și și dv, atunci fiecare astfel de posibilitate este asociată cu un operator separat de reducere a problemei Conform regulii de integrare a sumei funcțiilor, avem p p ft(x)dx = Jfi(x)dx î-=li=l Această regulă justifică următoarea reducere a sarcinii la subsarcini: O altă regulă, numită regula de a scoate factorul constant din semnul integral, ne permite să înlocuim problema J kf(x) dx cu problema țf(x)dx Astfel, obținem o astfel de reducere a problemei Jkf(x) dx eu ff(x) dx Operatorii rămași ai unei singure expresii integrale generează vârfuri "SAU" Aceste procese de suflare: efectuează o înlocuire în celălalt, și astfel operatorii se bazează pe abia-" Exemple de reducere a unei sarcini la un set de subsarcini Substituții algebrice Exemplu [fl( e z + )dz, z = ( + x) / , J ( + Zx) / J Substituții trigonometrice Exemplu f -? -► [-I- ctg Ѳ cosec Ѳ cfâ, x = tg Ѳ J x / x + J s Împărțirea numărătorului la numitor Exemplu Complement la pătratul complet Exemplu g dx g dx J (x - x + ) J [(x - ) + J * În orice etapă dată a procesului, avem mulți operatori alternativi de reducere a problemelor care ar putea fi aplicați Dacă pentru fiecare sarcină folosim toate aceste alternative aplicabile, atunci problema de enumerare rezultată va deveni foarte repede neînchipuit de greoaie În probleme de acest tip, este foarte important să se implice considerații euristice care să facă posibilă limitarea numărului de vârfuri generate În această problemă de integrare, unii operatori de reducere sunt atât de utili încât ei (și numai ei) ar trebui folosiți în toate cazurile în care sunt aplicabili Astfel, informația problemei, corespunzătoare integrării sumei și eliminării multiplicatorului, este folosită ori de câte ori este posibil Utilitatea altor reguli și operatori, cum ar fi substituțiile trigonometrice, depinde în mare măsură de forma integrandului Într-un sistem de integrare simbolică (Slagel, a), pentru care a fost scris un program, toți integranții au fost clasificați în funcție de caracteristicile pe care le posedă Pentru fiecare clasă de integranți au fost aleși diferiți operatori în funcție de aplicabilitatea lor euristică Exemplu de soluție Pe fig Figura prezintă un grafic de enumerare "ȘI/SAU" format ca urmare a unui proces similar cu cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini considerat mai sus )- Problema este integrarea expresiei J ( , ) / dX- Vârfurile graficului sunt descrieri ale sarcinilor și fiecare dintre ele conține o integrală Vârfurile finale (corespondente Începeți de sus x - sin y Orez Graficul de enumerare "ȘI/SAU" pentru problema de integrare, integrale tabulare) sunt marcate cu cadre duble Arcurile aldine evidențiază graficul de decizie pentru această problemă Pe *) Exemplul se bazează pe o problemă de integrare care a fost rezolvată prin programul lui Slagel ( a) Exemple de reducere a unei sarcini la un set de subsarcini Pe baza acestui grafic de decizie și integrale de tabel, stabilim că x ( - x ) / dx \u d arc sin x + -g- tg (arc sin x) - tg (arc sin x) Până acum, desigur, nu am spus nimic despre ordinea în care sarcina se reduce la subsarcini Această problemă va fi tratată în capitolul următor, care tratează metodele de enumerare atunci când se reduc sarcinile la un set de subsarcini Demonstrarea teoremelor în planimetrie exemplu R n s Desen pentru exemplul considerat al teoremei geometrice Dat: ZABD=^CBD, AD ± BA, CD ± BC Demonstrați: AD = CD (dar nu sistemul nostru de sarcini) poate obra-fig pentru cele corespunzătoare Demonstrațiile teoremelor în planimetrie dau alte probleme care pot fi rezolvate prin reducerea la subprobleme Să presupunem, de exemplu, că trebuie să demonstrăm următoarea teoremă: orice punct de pe bisectoarea unui unghi este echidistant de laturile sale Să fie formulată problema sub următoarea formă: Dat: Z DBA = Z DBC, ADX BA, CDA BC, unde DB este un segment de dreaptă, &BCD este un triunghi, Z\BAD este un triunghi Se cere să se dovedească: AD = = CD Cititorul deciziei este atras de desen, de sarcină (Mai târziu vom discuta despre modul în care un sistem de rezolvare a problemelor poate folosi și planul ) Vom reprezenta acest tip de problemă ca o expresie a formei S| T, unde rămâne de demonstrat, iar T este mulțimea premiselor Apoi exemplul nostru este descris de următoarea expresie: S este afirmaţia că AD = CD Z DBA = Z DBC, AD BA, CD BC, DB, ABCD, &BAD Problemele elementare sunt problemele dovedirii afirmațiilor despre care dorim să le presupunem Ch Vizualizări care permit ca sarcinile să fie reduse la subsarcini că sunt adevărate De exemplu, în lista sarcinilor elementare am putea include printre altele următoarele sarcini ): Р ХХі \u d ZXî \ ZXi - unghi drept, ZX - unghi drept (unghiurile drepte sunt egale între ele); Р ХіХ = ХіХ (segmentul este egal cu el însuși); RZ XXi == XXi (unghiul este egal cu el însuși); P DHLXz Drtr r XzXi \u d Y YU ZX XtX \u d ZY ^ Yz, IXXlX X =XY,YzY (latura, unghi, unghi = latura, unghi, unghi); Р ZXtM - direct IXіХ ± ХЖз (două segmente perpendiculare care se intersectează definesc un unghi drept); R HL == U G DH(X X D LU U (laturile corespunzătoare ale triunghiurilor congruente sunt egale) Într-un program suficient de puternic pentru demonstrarea teoremelor geometrice, desigur, ar trebui folosite multe alte formule mai elementare Formulele pe care le-am dat sunt suficiente pentru a ilustra procesul de demonstrare a teoremei noastre Pentru a reduce problema la subprobleme, introducem un număr suficient de premise noi pentru a face din această problemă un caz special al unei afirmații adevărate Setul de afirmații adevărate potrivite pentru aceasta ar putea fi un subset de probleme elementare Subproblemele obținute în acest caz vor fi problemele dovedirii de noi premise (cu condiția, desigur, să fie date vechile premise) Pentru a reduce numărul de seturi diferite de subsarcini, vom cere ca aceste premise suplimentare să menționeze doar acele elemente care au apărut deja în premisele inițiale Deoarece, de regulă, va exista un număr mare de premise noi care îndeplinesc aceste condiții, vom avea în continuare un număr foarte mare de seturi diferite de subsarcini Fiecare dintre ele corespunde aplicării unui operator separat de reducere a sarcinilor Să arătăm cum un sistem destul de simplu de demonstrare a teoremelor geometrice ar putea demonstra teorema care a fost formulată la începutul secțiunii În acest exemplu, vom folosi ca probleme elementare doar mulțimea {PI, , P } menționată mai sus Când adăugăm premise pentru a face o afirmație adevărată, vom considera și că doar membrul ') Ca și în exemplul de integrare, expresiile problemelor elementare sunt definite prin formule Exemple de reducere a unei sarcini la un set de subsarcini ns din mulțimea indicată corespund afirmațiilor adevărate mG' În primul rând, împărțim problema principală AD = CD\T în subsarcini (unde pentru simplitate am notat cu T mulțimea tuturor premiselor) Singura sarcină elementară care poate fi folosită pentru aceasta prin adăugarea premiselor la T este P : X X \u d Y Y A VDHz ~ A YtY Y Pentru ca această sarcină să ne fie utilă, trebuie să setăm X = A, X = D, Y = C, Y = D, astfel încât avem nevoie de o premisă de forma /\X,AD AU(Ct> Deoarece doar triunghiurile A BCD și ABLD sunt menționate în T, setăm Xi - B și Y; = B Astfel, reducem originalul nostru problemă la sarcină ABAD^A BCD\T Ca urmare a reducerii acestei probleme (prin adăugarea de premise compatibile cu P ), apare următorul set de subsarcini: DB = DB\T, Z BAD= Z BCD, Z BAD=> Z BCD\T Continuând acest proces într-un mod similar, ajungem la graficul de decizie de tip AND/OR prezentat în Fig Din cauza ofertei limitate de sarcini elementare (corespunzând bine exemplului nostru, dar insuficiente în cazul general), nu apar seturi suplimentare de vârfuri de tip "ȘI" în acest proces Cititorul ar putea vedea la ce ar duce adăugarea câtorva sarcini mai elementare, cum ar fi A X'X X ~ A U, U U X, X \u d YіUg, Z VDHz \u d Z Y ^ guz, X ^ - Y Y (lateral-colț-lateral) Un mijloc important de control al numărului de vârfuri generate în graficele "ȘI/SAU" este utilizarea modelelor Aici înțelegem un model ca o interpretare specifică a unei afirmații logice generale Afirmațiile pe care trebuie să le dovedim sunt adesea afirmații generale care acoperă un număr mare de cazuri particulare Oricare dintre aceste cazuri speciale ar putea fi folosit ca model pentru o declarație generală Dacă această afirmație generală poate fi de fapt dovedită, cu atât mai mult, orice caz special va fi în mod evident adevărat în modelul corespunzător Ca exemplu, luați în considerare teorema tocmai demonstrată: AD - CD Z DBA = Z DBC, AD BA, CD L BC, DB, A BCD, ABAD cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini Această problemă poate fi considerată ca o problemă care conține o anumită afirmație, care poate fi dovedită formal printr-un proces abstract de manipulare a simbolurilor folosind reguli pur sintactice pentru a reduce problema la un set de subprobleme În același timp, îl putem interpreta ca o afirmație semnificativă despre puncte reale, segmente etc de pe plan Din punct de vedere semantic, această afirmație spune: Caz special P Caz special P Orez Graficul de decizie "ȘI/SAU" pentru demonstrația considerată a teoremei că, indiferent de locația reală a acestor puncte pe plan, atâta timp cât ipotezele de mai sus sunt adevărate, lungimea segmentului AD va fi întotdeauna egală cu lungimea segmentului CD Adică, am putea măsura de fapt lungimile acestor segmente și să ne asigurăm că sunt egale Desigur, înainte de a avea ocazia de a măsura ceva, trebuie să luăm un caz special al acestor premise și să indicăm locația reală a acestor puncte și segmente, așa cum sa făcut la construirea Fig Un astfel de exemplu special servește drept model pentru afirmația noastră Desigur, dacă afirmația este deloc demonstrabilă, atunci interpretarea sa pe modelul dat trebuie să fie adevărată Și invers, dacă se stabilește că o anumită interpretare într-un anumit model nu este adevărată, atunci este evident că această afirmație Exemple de reducere a unei sarcini la un set de subsarcini judecata nu poate fi dovedita Utilizarea unui model ca "măsură" a nedemonstrării anumitor afirmații posibile poate duce adesea la excluderea din luarea în considerare a unui număr mare de vârfuri de graf generate inutile Să ilustrăm utilizarea modelului pentru problemă AB \u d BC BD \u d AB, £ BDC - £ DC B, BC, DC CD, AD, &DAB, ADBC Presupunem că demonstratorul de teoreme are acces la desenul din Fig Această problemă ar trebui rezolvată în mod direct prin introducerea premisei BC - BD Orez Desen pentru o problemă geometrică Dat: BD - AB, Z BDC = Z DCB DAB, LOVS Demonstrați: AB = BC şi formulări ale subproblemei dovedirii acestei premise Dar înainte de a se obține o soluție, se va introduce și premisa £JDAB^£\DBC într-un dispozitiv simplu de demonstrare a teoremelor și se va formula problema demonstrației sale Este evident că egalitatea ADAB & DBC nu poate fi dovedită din aceste premise Făcând calcule simple pe acest desen (Fig ), rezolvatorul acestei probleme ar putea determina cu ușurință că triunghiurile &DAB și &DBC ale modelului nu sunt egale între ele și, în acest fel, află că subproblema &DAB & DBC este de nerezolvat După aceea, această sarcină secundară ar putea fi eliminată din lista de noduri "promițătoare" De obicei, este ușor să oferiți un program de demonstrare a teoremei cu un model Pentru teoremele geometrice, un astfel de model ar putea fi un desen construit conform premiselor și prezentat corespunzător sub forma unei liste de coordonate, linii, segmente etc , pe baza căreia ar putea exista cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini măsurătorile se fac folosind, de exemplu, geometria analitică În același timp, trebuie avut grijă ca locația punctelor selectate să fie cea mai generală, nepermițând apariția unor coincidențe aleatoare, paralelisme etc teoreme folosind acest desen nu ar putea nici atunci să obțină o demonstrație pentru o aserțiune nedemonstrabilă (Erorile de desen pot duce la încercări de a dovedi afirmații nedemonstrabile Cu toate acestea, acestea ar fi în mod evident fără succes ) Erorile pot duce, de asemenea, la Orez Un exemplu care necesită construirea unui segment auxiliar Dat: Soare || AD, BC = AD Demonstrați: AB = CD la respingerea afirmațiilor cheie demonstrabile, în urma cărora dovada se poate dovedi a fi mai lungă sau poate să nu fie găsită deloc De obicei, aceste complicații pot fi prevăzute și, ca urmare, se poate obține o creștere semnificativă a eficienței găsirii unei soluții la utilizarea unui desen Gelernter și colab ( ) au arătat că utilizarea unui desen într-un demonstrator de teoreme geometrice reduce numărul mediu de vârfuri copil de la la per vârf părinte Programul Gelernter a avut și capacitatea de a adăuga câteva linii auxiliare unui desen existent Luați în considerare, de exemplu, următoarea problemă: AB \u d CD ABCD este un patrulater, segmentul BC este paralel cu segmentul AD, BC - AD, AB, CD Demonstratorul teoremei se poate referi la desenul din fig Când încercăm să construim vârfuri după vârful inițial prin adăugarea de premise, demonstratorul nostru de teoreme nu poate, din păcate, să încerce să aplice o astfel de problemă elementară precum AB = CD\&ABD = /\BDC, deoarece triunghiurile ĂABD și & BDC nu sunt menționate Mecanisme de planificare pentru reducerea sarcinilor la subsarcini găsite în pachetele noastre Să presupunem că nu pot fi găsite vârfuri ulterioare Apoi, în absența unor subsarcini alternative, cu care în acest caz este posibil să se lucreze, dispozitivul nostru se va întoarce din nou către acele sarcini elementare, pentru care anterior s-a considerat că acestea sunt inaplicabile, deoarece conțin elemente nemenționate în premise În cazul utilizării AB = CD]AABD ABDC, următoarea structură grafică "ȘI/SAU" este generată sub vârful de pornire: Sarcinile etc și ABDC\ etc sunt luate ca elementar (trei puncte definesc un triunghi) Rezultatul acestei operații este echivalent cu construirea unui segment BD pe desen, formând pe acesta două triunghiuri După o astfel de construcție, proba poate fi continuată în mod obișnuit MECANISME DE PLANIFICARE CÂND ÎNCĂRTAREA SARCINILOR ÎN SUBSARCINI În această secțiune, descriem o metodă de reducere a unei probleme la o colecție de subprobleme, în care problemele de căutare în spațiul de stare sunt reduse succesiv la unele din ce în ce mai simple care pot fi rezolvate trivial În plus, acest proces de reducere a sarcinilor este ghidat de un tip de mecanism de planificare care joacă un rol foarte important în inteligența artificială Să presupunem că dorim să reducem problema de căutare în spațiul de stare definită de tripla (S, F, G) la o colecție de probleme de căutare mai simple în spațiul de stare Dacă am putea evidenția o secvență de "stări intermediare de bază" corespunzătoare ') gi, g , gif, atunci am fi capabili să reducem problema inițială la un set de probleme definite prin triplete (S, F, { gi}), ■)' În original, reperele sunt "stâlpi kilometrici" - Aprox ed cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini ({gi},F, {g }), • ••> ({£n},F,G) Rezolvarea tuturor acestor probleme este echivalentă cu rezolvarea problemei inițiale Dacă aceste stări intermediare de bază gt, gi, , gx sunt definite în mod explicit, atunci nu are nicio diferență în ce ordine sunt rezolvate problemele rezultate Uneori, însă, reușim să definim o mulțime Gi de stări, fiecare dintre acestea putând servi ca primă stare intermediară principală, o mulțime G de stări, fiecare dintre acestea putând servi ca a doua și așa mai departe Apoi problema descrisă de triplul {S , F, GJ, trebuie rezolvat mai întâi, astfel încât o anumită stare gi e Gt să poată fi găsită înainte de formularea următoarei probleme ({gi}, F, G ) și așa mai departe În secțiunea următoare, vom descrieți un truc interesant pentru a găsi aceste seturi de stări intermediare de bază OPERATORI CHEIE În multe probleme de căutare în spațiul de stare, este ușor să vă dați seama cum să izolați cel puțin un operator de spațiu de stat pentru a fi undeva în lanțul de decizie al operatorilor Adică, deși sarcina de a găsi întregul lanț de operatori în soluție este destul de dificilă, sarcina de a selecta unul dintre ei se dovedește adesea a fi ușoară Întâmpinăm posibilitatea izolării unui astfel de operator atunci când, prin natura problemei, utilizarea unuia dintre operatori este considerată un pas necesar în rezolvarea problemei (Pe graficele de stat-spațiu, utilizarea unui astfel de operator corespunde desenării unui arc care conectează două părți practic separate ale graficului ) De exemplu, în problema piramidei considerată mai sus, operatorul "mută discul C pe pilonul " poate fi distins ca operator absolut necesar pentru rezolvarea problemei (vezi Fig ) Vom apela operatori de acest fel operatori cheie Când poate fi găsit un operator cheie, acesta poate fi folosit pentru a determina o stare intermediară de bază în procesul nostru de reducere a problemelor Să presupunem că un f din F este un operator cheie pentru problema dată de triplu (S, F, G) Deoarece presupunem că operatorul f trebuie aplicat, prima sarcină care urmează din (S, F, G) este problema găsirii unei căi către o stare la care f este aplicabil Fie Gf setul de stări cărora f este aplicabil Apoi avem o subsarcină descrisă de triplu (S, F, Gf) Odată rezolvată o astfel de subproblemă și numită starea g e Gf, putem formula problema elementară ({g}, F,{f(g)}), unde f(g) este starea atinsă după aplicarea operatorului f la stat g Această sarcină este elementară, deoarece este rezolvată simplu Diferențele prin aplicarea operatorului cheie f Ne rămâne acum cu o problemă descrisă de triplu ({f(g)}, F, G) Astfel, când operatorul cheie f poate fi găsit în spațiul de stări, se poate folosi următoarea metodă de reducere a problemei: (Am simplificat această schemă prin neindicarea pe ea a subproblema elementară ({g}, F, {f(g)}) ) Aceste două probleme rezultate pot fi rezolvate în continuare fie prin enumerare directă în spațiul stărilor, fie prin continuarea reducându-le Dacă strategia noastră este să recurgem la reducerea în continuare a sarcinilor la subsarcini, atunci trebuie să definim un operator cheie pentru sarcină (S, F, Gf), etc În majoritatea problemelor, nu reușim să selectăm întotdeauna un singur operator cheie, despre care se știe că utilizarea lui este absolut necesară în rezolvarea problemei În schimb, reușim doar să specificăm un anumit subset de operatori astfel încât unul dintre ei, cu un grad de probabilitate suficient de mare, să fie un operator atât de esențial Fiecare operator din acest subset formează o pereche de subsarcini rezultate Un proces de enumerare bazat pe această idee ar duce la construirea unui grafic AND/OR atunci când se caută o soluție între diverse alternative Înainte de a putea aplica această metodă, pentru orice problemă de căutare în spațiul de stare, trebuie să specificăm o modalitate de a construi un set de operatori care pot fi candidați pentru cei cheie În secțiunea următoare, vom descrie o anumită metodă bazată pe diferențe DIFERENȚE O modalitate de a găsi operatori care ar putea fi cheie este de a calcula diferența pentru o anumită problemă (S, F, G) Mai simplu spus, diferența pentru triplu (S, F, G) este o listă parțială de motive pentru care elementele mulțimii S nu îndeplinesc condițiile pe care ar trebui să le îndeplinească stările țintă (mulțimea ) (Dacă un element al mulțimii S este în G, atunci cap Vizualizări care permit ca sarcinile să fie reduse la subsarcini problema noastră este rezolvată și nu există nicio diferență ) De exemplu, dacă setul de stări țintă G este determinat de un grup de condiții impuse stărilor și dacă un element s eS satisface unele, dar nu toate aceste condiții, atunci diferența poate fi o listă parțială a acelor condiții pe care elementul s nu le îndeplinește Dacă aceste condiții pot fi aranjate în ordinea importanței lor, atunci distincția ar putea fi pur și simplu cea mai importantă dintre ele În continuare, atribuim fiecărei diferențe posibile un operator (sau un set de operatori) din spațiul de stări Aceștia sunt operatorii care pot fi cheie Un operator este asociat cu o diferență numai dacă aplicația sa poate elimina diferența Să ilustrăm cum funcționează acest proces în legătură cu problema maimuțelor și bananelor Această problemă a fost discutată în cap în legătură cu utilizarea schemelor de descriere a statului Amintiți-vă că aceste diagrame au avut forma (w, x, y, z), unde w este poziția maimuței în plan orizontal (un vector bidimensional); x este egal cu sau în funcție de faptul că maimuța este sau nu pe cutie; y este poziția cutiei în plan orizontal (vector bidimensional); z este sau , în funcție de dacă maimuța primește sau nu banane Există patru operatori ale căror acțiuni și condiții de aplicabilitate sunt date de următoarele reguli de rescriere: ft (w, , y, z) -► (u, , y, z), f (w, , w, r) > (v, , v, r), / (w, , w, r) -> (w, , w, r), A (s, , s, O) * (s, , s, ), unde c este punctul de podea direct sub banane Condiția scopului este îndeplinită pentru descrierile de stări numai dacă ultimul element din această schemă de descriere a stărilor este Starea inițială este dată de listă (a, , b, ) Dacă F = (flt f , f , fi} este un set de patru operatori și G este un set de stări țintă, atunci problema noastră inițială devine ({(a, , b, )}, F, O) Deoarece setul de operatori rămâne neschimbat în această problemă, simbolul F poate fi omis și întreaga problemă pro, sută poate fi notată ca ({(a, , b, )}, G) Diferențele Acum, procedura de reducere a unei sarcini la un set de subsarcini folosind conceptul de operatori cheie poate fi descrisă după cum urmează: În primul rând, calculăm diferența pentru problema inițială Pentru listă (a, , b, ), constatăm că nu satisface scopul propus, deoarece ultimul element din ea nu este egal cu Operatorul cheie (responsabil pentru reducerea acestei diferențe este "grabul" operatorul f ) (Presumăm că relațiile dintre posibilele diferențe și operatorii lor cheie sunt date de la început soluției de probleme ) Folosind operatorul ft pentru a reduce problema inițială, ajungem la următoarea pereche de subprobleme: ({(a, , b, )), Gh) și (tf Enumerare pe grafice de tip "ȘI/SAU" ( ) Îndepărtați din lista DESCHIS toate nodurile care sunt rezolvabile sau au vârfuri precedente rezolvabile ( ) Treceți la ( ) Un exemplu de secvență în care vârfurile sunt extinse în metoda de căutare în adâncime este prezentat în fig În acest exemplu, adâncimea graniței este luată egală cu Cercurile negre arată vârfuri rezolvabile, cercurile albe arată cele nerezolvabile, iar arborele de decizie este marcat cu ramuri aldine Enumerare pe grafice de tip "ȘI/SAU" Ori de câte ori procesul de reducere a unei sarcini la un agregat Orez Arborele "ȘI/SAU" care arată ordinea în care vârfurile sunt extinse atunci când se repetă în adâncime (adâncimea maximă este ) existența subsarcinilor conduce la construirea unui nod copil, echivalent cu o anumită descriere a problemei, deja construită mai devreme în procesul de iterație, structura rezultată poate fi reprezentată mai eficient nu ca un arbore, ci ca un grafic "ȘI/SAU" în care nodurile pot avea mai multe vârfuri părinte Dacă avem capacitatea de a recunoaște cazuri de echivalență a descrierilor sarcinilor, atunci problema de căutare poate fi în cazul general simplifica semnificativ, deoarece este suficient să rezolvi o singură dată subsarcini identice În plus, structura generală a graficului poate conține cicluri inutile (care oferă lanțuri ciclice de raționament) pe care le-am putea întâlni, dar nu le putem detecta dacă le considerăm diferite în realitate descrieri de sarcini identice Câteva exemple de grafice "ȘI/SAU" ale căror vârfuri pot avea mai mult de un vârf părinte sunt prezentate în Fig Vârfurile finale sunt marcate cu litera t, iar graficele decisive sunt marcate cu margini aldine Rețineți că graficele din fig , a, b au subgrafe decisive, iar graficul din fig , nu există astfel de subgrafe, deoarece bucla nu poate fi evitată pe el S-ar părea că se poate presupune că pentru a nu intrați în ciclu, ar trebui să refuzați să construiți acele vârfuri copil pentru un anumit vârf care ar fi anterior pentru acest vârf De fapt, o astfel de regulă ar putea conduce la excluderea din luarea în considerare a anumitor Ch Metode de căutare pentru reducerea sarcinilor la subsarcini soluții corecte aciclice De exemplu, dacă vârfurile sunt extinse în ordinea prezentată în Fig , cu siguranță dorim să includem vârful ca un copil al lui în (deși vârful îl precede și pe ), pentru că altfel nu am obține soluția (poate singura) afișată prin ramuri aldine t V Orez Unele coloane "ȘI/SAU" Când se încearcă definirea unei proceduri de enumerare pentru un grafic (mai degrabă decât un arbore) de tip "ȘI/SAU", apar o serie de complicații În primul rând, o definiție rezonabilă a procedurii de căutare exhaustive ar implica probabil alegerea pentru următoarea extindere a vârfului din lista DESCHIS care are cea mai mică adâncime Acum, însă, este ceva mai dificil decât în cazul copacilor să dai o bună definire a adâncimii Ca și în cazul graficelor normale, adâncimea unui vârf într-un grafic AND/OR este definită după cum urmează: Adâncimea vârfului de pornire este Adâncimea oricărui alt vârf este cu mai mare decât adâncimea celui mai apropiat vârf părinte Costurile arborelui de decizie vârful (prin arcul a), deși în acest caz apare un ciclu A doua complicație este legată de necesitatea de a seta pointeri* care merg de la un punct dat la mai mult de un vârf părinte Toate aceste indicatoare pot fi necesare în determinarea graficului de decizie (De exemplu, în Fig , soluția trebuie să conțină în mod necesar indicatori care merg de la vârful la vârfurile și ) Pe de altă parte, este posibil ca unii dintre acești indicatori multipli să nu fie necesari în soluție (de exemplu, în înapoi până sus ) Prin urmare, în procedura de forță brută pe graficul "ȘI / SAU", ar trebui să fie posibilă analizarea structurii indicatorilor graficului de forță brută după încheierea lucrării pentru a elimina indicatorii irelevante și a le salva pe cele necesare în graficul decisiv În mod similar, la construirea nodurilor copil, trebuie făcută o verificare specială pentru a vedea dacă vreunul dintre aceste vârfuri este deja ÎNCHIS și nu a fost marcat anterior ca decidabil sau ca indecidibil Dacă în același timp am ajuns la un nod copil deja rezolvabil (sau nerezolvabil) de-a lungul unei noi căi, atunci este necesar să folosim procedura de etichetare pentru a verifica dacă nodul inițial este rezolvabil (sau nerezolvabil) Lăsăm cititorului dezvoltarea algoritmilor de enumerare pe grafice arbitrare de tip AND/OR ca exercițiu Următoarea noastră sarcină va fi să studiem modalități de a eficientiza procesul de deschidere a nodurilor folosind funcții de evaluare Din nou, considerația noastră va fi mult simplificată dacă ne limităm la cazul arborilor "ȘI/SAU" COSTURI ALE ARBORILOR DE DECIZIE În enumerările din spațiul de stări, am avut ocazia să folosim funcții de evaluare derivate euristic pentru a eficientiza procesul de deschidere a vârfurilor Conceptul cheie în definirea acestor funcții de evaluare Ch Metode de căutare pentru reducerea sarcinilor la subsarcini a fost conceptul unei funcții euristice care estimează costul unei căi optime de la un vârf la un scop În arborii "ȘI/SAU", conceptul corespunzător este legat de estimarea costului unui arbore de decizie înrădăcinat la un punct dat Desigur, înainte de a decide cum să estimam costul unui arbore de decizie înrădăcinat la un punct dat, trebuie să definim ce înțelegem prin costul ȘI/SAU al unei decizii Este ușor de definit două concepte diferite, fiecare dintre ele atribuind anumite costuri arcurilor arborelui de decizie: costul total*, care este suma costurilor tuturor arcurilor din arborele de decizie și costul maxim, definiția de care se bazează pe conceptul de cale de-a lungul arborelui de decizie (Numim o cale de-a lungul unui arbore înrădăcinat la vârful n o succesiune de vârfuri (nb n , , "a) ale arborelui, unde nb - n, pk este vârful final, iar vârful P] este un copil al pt când j - , , k ) Suma costurilor arcurilor care leagă vârfurile unei căi, costul traseului Cost maxim - R n s Soluția L Total Bridge= Cost maxim= Doi arbori de decizie și costuri Soluția B Cost total= Valoarea maximă la aștepta- al lor vom suna este costul căii prin arborele de decizie care are maximum Preț Aceste definiții pot fi explicate pe arborele de decizie prezentat în Fig , în care numerele de lângă arce indică valorile acestora din urmă Există două soluții aici Una dintre ele este marcată cu linii aldine (soluția ), iar cealaltă (soluția B) cu linii încrucișate Soluția A are un cost total de , maximul este , iar soluția B are un cost total de , maximul este Care dintre aceste soluții este de preferat depinde, desigur, de costul pe care încercăm să-l minimizăm Adesea se presupune că costul arcurilor este egal cu unul În acest caz, costul total este pur și simplu numărul de vârfuri din arborele de decizie, minus unu În mod similar, costul maxim oferă lungimea celui mai lung lanț de pași din arborele de decizie În orice caz, o estimare rezonabil de bună a oricăruia dintre aceste costuri poate fi aplicată util într-o funcție de estimare și, astfel, eficientiza enumerarea Arborele de decizie în sine este un subarboresc al unui arbore ȘI/SAU implicit definit de inițială Utilizarea estimărilor de cost pentru căutarea prin forță brută o descriere detaliată a problemei, un set de operatori pentru reducerea problemei la subsarcini și un set de sarcini elementare În cadrul întregului arbore implicit AND/OR, dorim să găsim arborele de decizie de cost minim Un astfel de arbore de decizie va fi numit arbore optim Notați cu h(s) costul unui arbore de decizie optim înrădăcinat la vârful inițial s Oferim o definiție recursivă a costului minim h(s) în termeni de cost minim h(n) al unui arbore de decizie înrădăcinat la orice vârf n Să notăm costul arcului dintre vârful nі și vârful său copil P ] ca c(nі, nj) Dacă n este vârful final (corespunzător unei probleme elementare), atunci h(n) = Dacă n nu este vârful final și are drept copil vârfurile nit , "al-lea tip" SAU ", atunci h (n) \u d min [s (n, Pі) + h ("/)] -i Dacă n nu este vârful final și are ca vârfuri secundare vârfurile ts, , "al-lea tip" și ", atunci pentru costurile totale k h (n) \u d [c (n, rit) + h (",)], i \u d iar pentru valoarea maximă h (n) - max [c (n, nt) - h (";)] i Desigur, funcția d(n) nu este definită dacă vârful n este de nerezolvat UTILIZAREA ESTIMĂRILOR DE COSTURI PENTRU SECULTAREA DIRECT Vom fi interesați să găsim arbori de decizie care să ofere costul minim (fie total, fie maxim, în funcție de situație) Pentru a face acest lucru, vom folosi conceptul de cost estimat al unui arbore de decizie Fie H o funcție astfel încât, pentru fiecare vârf n care nu este de nerezolvat, H(n) servește ca o estimare a h(n), adică costul unui arbore de decizie optim înrădăcinat la n Vom numi H o euristică și o vom folosi pentru a simplifica procesul de deschidere a vârfurilor În procesul de enumerare pe care îl descriem, se construiește un arbore de enumerare În orice stadiu al acestei enumerari, în partea de jos a copacului, Cap Metode de căutare pentru reducerea sarcinilor la subsarcini Borul conține vârfuri de unul dintre următoarele trei tipuri: ) vârfuri recunoscute ca finale în procesul de enumerare; ) vârfuri cu privire la care, în timpul enumerarii, s-a constatat că nu sunt definitive și nu au vârfuri copil; ) vârfuri pentru care vârfuri copil nu au fost încă construite în timpul enumerarii Vom numi oricare dintre aceste vârfuri din arborele de enumerare un vârf final Descriem acum cum, pentru fiecare vârf m al arborelui de enumerare, trebuie construită funcția euristică d(x) i-terminal anvelopă superioară Dacă se stabilește că n este vârful final, atunci Q(n) = Dacă se spune că n nu este vârful final și nu are vârfuri copil, atunci funcția P(n) este nedefinită Dacă nodul n nu a construit încă noduri copil, atunci d(i) este considerată o estimare euristică a costului valorii h(i) a arborelui de decizie optim înrădăcinat la nodul n O astfel de estimare ar putea fi făcută pe baza informațiilor euristice referitoare la originea problemei, reprezentată de arborele nostru AND/OR i este un vârf neterminal care are vârfuri copil l nі tip "SAU" Funcția euristică fî(n) este dată de formula Ig (i) \u d navă [s (i, I /) + Ig (yag)] ' i l este un vârf neterminal care are vârfuri copil Pt tastați "eu" Funcția euristică fî(n) pentru costurile totale per este dat de formula /g(i) == [c(i,i,)h(i,)], /=i iar pentru costuri maxime - prin formula /r (i) = verifica [s (i, n{) -r c (i,)] Utilizarea estimărilor de cost pentru căutarea prin forță brută Deoarece fî(n) = pentru vârfurile finale, definiția noastră garantează că pentru H sh arborele de enumerare va include întregul nostru arbore AND/OR Mai mult, arborele de căutare din fiecare etapă conține un set de subarbori înrădăcinați în s, fiecare dintre care, în funcție de rezultatele expansiunii ulterioare a vârfurilor, ar putea deveni vârful arborelui decizional complet Numim acești arbori arbori de decizie potențiali pentru s Pentru fiecare vârf care are vârfuri copil de tipul "SAU", în arborele de căutare, puteți selecta un arbore de decizie potențial separat corespunzător fiecăruia dintre nodurile copil de tip "SAU" În mod similar, există și arbori de decizie potențiali înrădăcinați la vârful n care ar putea rezolva subproblema corespunzătoare acestui vârf (Desigur, cu excepția cazului în care acel vârf este deja marcat ca nerezolvabil ) La fiecare pas al procesului de enumerare, se poate extrage din arborele de enumerare acel arbore de decizie potențial care este înrădăcinat la s și estimat a servi drept vârful unui arbore de decizie optim înrădăcinat la s Procedura de extracție folosește valori fi; Procedura se bazează pe următoarea definiție: Vârful inițial este inclus în m Dacă vârful n inclus în aceea, în arborele de enumerare are a) varfurile copil nі, , pc de tip "SAU", apoi cel pentru care valoarea lui [c(n, nі) + #(nі)] este inclus si in aceea (in cazul de valori egale, alegerea este arbitrară), b) vârfuri copil de tip "ȘI", atunci toate sunt incluse în aceea Acest arbore de decizie potențial, care este estimat a fi partea superioară a unui arbore de decizie optim înrădăcinat la s, este un concept cheie în "procesul de enumerare" euristic pe care urmează să-l descriem Procedura de ordonare relevantă aici este legată de întrebarea "Care dintre arborii de decizie potențiali este cel mai promițător de extins", și nu de întrebarea "Care dintre vârfuri este cel mai promițător de extins în pasul următor" (În mod similar, când iterăm prin spațiul de stări, alegând vârful cu valoarea minimă f = g + th, continuăm cu calea parțială cea mai promițătoare ) O vom lua ca arbore de decizie potențial cel mai promițător Pentru ca procesul nostru de iterație să extragă arborele t, trebuie să urmărim valorile lui x la fiecare vârf al arborelui de căutare După ce arborele este extras, sunt dezvăluite cele ale vârfurilor sale de capăt care nu au fost încă selectate pentru expansiune, iar pentru un astfel de arbore crescut, valorile lui J sunt recalculate Ch Metode de căutare pentru reducerea sarcinilor la subsarcini spre vârful deschis, pentru că pentru alte vârfuri nu se vor schimba (Valoarea lui R pentru un vârf depinde numai de valorile lui R pentru vârfurile care îl urmează ) Înainte de o descriere precisă a procesului de enumerare pe baza acestor idei, este necesar să avem mijloacele pentru a decide care dintre nodurile finale ale arborelui m să se deschidă în pasul următor Pot fi sugerate diferite metode Ar putea fi o idee bună să alegeți nodul a cărui expansiune ar infirma cel mai probabil ipoteza că To ar fi vârful arborelui de decizie optim Într-adevăr, dacă To nu este partea superioară a arborelui de decizie optim, deși este în prezent evaluat ca atare, atunci eficiența procedurii de enumerare necesită ca acest fapt să fie descoperit cât mai repede posibil Considerații suplimentare cu privire la această problemă vor fi date în Sect Deocamdată, să presupunem că avem câteva mijloace de a determina ce vârf de capăt să se extindă în continuare Algoritm de enumerare ordonat pentru arbori AND/OR Putem oferi acum o listă de pași care definesc un algoritm de căutare ordonat pentru arbori AND/OR Acești pași sunt doar puțin diferiți de pașii de forță brută: ( ) Puneți vârfurile de pornire s în lista de vârfuri numită OPEN și calculați H(e) ( ) Obțineți un arbore de decizie potențial care este estimat a fi vârful arborelui de decizie optim înrădăcinat la , folosind valorile R pentru vârfurile arborelui de enumerare ( ) Selectați un vârf terminal al arborelui m , care se află în lista DESCHIS, și plasați-l în lista de vârfuri numită ÎNCHIS Desemnați acest vârf ca p ( ) Dacă n este vârful final, atunci marcați n ca fiind determinabil și continuați În caz contrar, accesați ( ) ( ) Aplicați la aceasta procedura de etichetare a vârfurilor rezolvabile ( ) Dacă vârful inițial este marcat ca rezolvabil, atunci rezultatul este To ca arbore de decizie; altfel continua ( ) Scoateți din lista OPEN toate nodurile care au nodurile precedente rezolvabile ( ) Mergeți la ( ) ( ) Aplicați operatorul Г la n și construiți toate nodurile copil pentru n Dacă nu există vârfuri copil, atunci marcați ver Algoritm de enumerare ordonat pentru arborii YILI bus n ca de nerezolvat și treceți la etapa următoare În caz contrar, accesați ( ) ( ) Se aplică la m procedura de etichetare a vârfurilor nerezolvabile ( ) Dacă vârful inițial este marcat ca nerezolvabil, atunci un semnal de eroare este trimis la ieșire În caz contrar, continuați ( ) Eliminați din lista OPEN toate nodurile care au vârfuri precedente nerezolvabile ( ) Treceți la ( ) ( ) Plasați aceste vârfuri copil în lista DESCHISĂ și urmăriți de la ele până la vârful n Calculați valorile lui x pentru aceste vârfuri Recalculați valorile lui Y pentru vârful n și pentru vârfurile anterioare ( ) Treceți la ( ) Schema bloc a acestei proceduri este prezentată în fig (Rețineți că, în cazul particular în care nu există vârfuri de tip AND, această procedură traversează arborele într-o manieră identică cu metoda de parcurgere ordonată în spațiul de stare În plus, dacă costul arcelor este egal cu unul, /i = pentru vârfurile finale și se utilizează definiția costului maxim, atunci această procedură conduce la aceleași rezultate ca și procedura de căutare exhaustivă ) Pe fig Figura prezintă o secvență de arbori de enumerare ipotetic care ilustrează funcționarea algoritmului nostru de enumerare ordonată Să presupunem că extinderea vârfului inițial a condus la arborele de căutare prezentat în Fig , a Numărul de lângă partea de sus indică valoarea lui x Pentru vârfurile finale, aceste valori servesc ca estimări euristice ale costurilor totale ale soluțiilor la problemele corespunzătoare Valorile lui d pentru celelalte vârfuri ale acestui arbore sunt obținute prin aplicarea definiției lui d(n) pentru costurile totale, presupunând costuri unitare pentru margini Pe baza acestor valori ale lui Y, este posibil să se obțină un potențial arbore de decizie care, conform estimării, ar trebui să fie partea superioară a arborelui de decizie optim Acest copac este evidențiat cu ramuri îndrăznețe Apoi, extindem un vârf terminal în acesta Să presupunem că, ca rezultat, arborele de enumerare prezentat în Fig b Datorită noilor valori ale lui d, arborele se mută acum într-o altă parte a arborelui de iterație Extinderea unui vârf în acest arbore duce apoi, să zicem, la arborele de enumerare din Fig , c Aici avem câteva vârfuri finale și, prin urmare, câteva vârfuri rezolvabile Sunt marcate cu cercuri negre Rețineți că valorile fi pentru vârfurile finale sunt zero După mai multe Orez Schema bloc a programului de enumerare ordonat pentru arbori "ȘI/SAU" Ch Metode de căutare pentru reducerea sarcinilor la subsarcini o expansiune, obținem în sfârșit arborele de decizie evidențiat în Fig , g ramuri îndrăznețe Costul total al acestui arbore este , calculat folosind valorile finale AND ADMISIBILITATEA ALGORITMULUI DE CĂUTARE COMANDATĂ (CĂUTARE) Ca și în cazul iterațiilor în spațiul de stare, se spune că un algoritm de căutare a arborelui AND/OR este valid dacă aplicarea sa duce întotdeauna la o soluție cu cost minim, cu condiția ca arborele de decizie să existe Vom demonstra acum că dacă limita η este o limită inferioară a valorii lui h pentru vârfurile deschise, atunci algoritmul de enumerare ordonată este admisibil Mai întâi demonstrăm următoarea lemă: Lema Dacă Jî(n) ^ h(n') pentru toate nodurile din listă OPEN, atunci în orice etapă a procesului de enumerare pentru toate nodurile construite ale arborelui de enumerare J(n) h(n), și pentru nodurile deja obținute ca rezolvabile, aici atingem egalitatea Dovada Se procedează cu demonstrarea prin inducție la nivelul arborelui de enumerare Pentru arborii de enumerare de nivel , lema este satisfăcută trivial, deoarece pentru astfel de arbori singurul vârf din arborele de enumerare este vârful inițial Dacă s este în lista DESCHIS, atunci d(h) ^d(h); dacă vârful s este solubil, fiind vârful final, atunci h(h) = h(s) = ' Să presupunem acum că lema este adevărată pentru arborii de enumerare de orice nivel mai mic sau egal cu un număr arbitrar I (/^ ) și să demonstrăm că este adevărată pentru arborii de enumerare de nivel / + Să luăm un arbore de enumerare de nivel + Deoarece I , atunci vârful inițial s are vârfuri imediat după el, să spunem vârfuri pi, nk Aceste vârfuri sunt rădăcinile subarborilor de cel mult nivel I, deci prin ipoteza de inducție lema este adevărată pentru toate nodurile acestor subarbori Cu alte cuvinte, pentru toate nodurile acestor subarbori h (se realizează egalitatea pentru vârfurile rezolvabile) Astfel, rămâne de demonstrat că d(s) h(s)/ va fi în cele din urmă dezvăluit După definiția lui fi (nu contează dacă este pentru costul total sau pentru cel maxim), atunci d(h) d > h(s), ceea ce contrazice Lema Cazul Algoritmul se încheie prin construirea unui arbore de decizie cu costuri non-minime În momentul încheierii, vârful s trebuie să se dovedească a fi rezolvabil și, în consecință, prin Lema , u($) = h(s) Dar valoarea lui R(s) la sfârșit trebuie să fie egală cu costul arborelui To, adică arborele de decizie găsit, și astfel această soluție are un cost minim ALEGEREA VERTEXULUI ÎN TO PENTRU URMĂTOAREA DESCHIDERE Este clar că proprietatea de admisibilitate a unui algoritm de enumerare ordonată cu valoarea lui x, care este limita inferioară a funcției h pentru vârfurile deschise, nu depinde de care dintre vârfurile de sfârșit din lista DESCHIS sunt alese pentru extindere Noi Alegerea unui vârf la m pentru următoarea expansiune S-a spus deja că poate cel mai rezonabil lucru de făcut ar fi să alegeți unul dintre vârfurile terminale în cel care are cea mai mare probabilitate-*) pentru a infirma ipoteza că acesta servește ca parte superioară a arborelui de decizie având minimum cost Dacă atunci servește de fapt ca parte a arborelui costului minim, atunci nu contează care dintre nodurile deschise din To să se deschidă în primul rând, deoarece în acest caz toate trebuie alese pentru deschidere într-un fel sau altul Cu toate acestea, dacă aceasta nu face parte din arborele de decizie privind costurile minime, atunci nu are rost să investim prea mult efort în enumerarea inutilă Apoi, mai întâi de toate, ar trebui să deschideți acel vârf în acel punct, care este cel mai probabil să detecteze o eroare făcută atunci când o alegeți Dacă sunt folosite costurile totale, atunci vârful care ar arăta cel mai probabil nepotrivirea atunci poate fi vârful deschis la acel, care are cea mai mare valoare a lui L va crește costul estimat (total) al arborelui atunci În cazul costurilor maxime, aparent, va fi util să alegem un vârf deschis în care, pornind de la vârful s, mergem de-a lungul arborelui apoi până la un vârf deschis, alegând un arc specific sub fiecare dintre vârfuri după cum urmează Ori de câte ori la acel moment întâlnim un vârf n cu mai multe vârfuri copil (de tip "I") n , n , , nk, atunci mergem la cel al vârfurilor copil nerezolvabile care maximizează valoarea [c(n, rit) (pi)] Vârful final atins ca urmare a unui astfel de proces ar trebui să fie acela nodul a cărui expansiune este cel mai probabil să afecteze negativ estimarea costului maxim al arborelui atunci În orice caz, nu putem demonstra optimitatea vreuneia dintre aceste metode de alegere a vârfurilor deschise Nu pare să existe un rezultat pentru arborii "ȘI/SAU" care să fie similar cu rezultatul pentru spațiul de stare în ceea ce privește deschiderea celui mai mic număr de vârfuri Intuitiv, totuși, pare plauzibil că, pentru orice metodă de alegere a unui vârf deschis în atunci, eficiența de enumerare este mai mare pentru acele funcții ale lui h care aproximează mai bine valoarea adevărată a lui h Cu cât limita inferioară pentru h folosită în J este mai bună, cu atât căutarea va fi mai îndreptată către arborele de decizie privind costul minim ') Folosim cuvintele "cea mai mare probabilitate" fără a le pune un sens formal Nici măcar nu vom încerca să determinăm probabilități sau să efectuăm analize statistice Ch Metode de căutare pentru reducerea sarcinilor la subsarcini MODIFICARI Ca și în cazul enumerarii în spațiul de stare, există o serie de moduri de a modifica algoritmul de enumerare ordonată de bază pentru a-l face mai practic în situații specifice În primul rând, în loc de a reconstrui un nou arbore de decizie potențial după fiecare expansiune a nodurilor, se poate extinde neîntrerupt unul sau mai multe vârfuri la acesta și mai multe dintre nodurile lor copil și apoi construi un nou arbore la acesta O astfel de strategie duce la o reducere a costului total al construirii atunci, dar în același timp, există riscul ca unele dintre nodurile descoperite să nu fie situate pe cel mai bun arbore de decizie potențial În cazul arborilor "ȘI/SAU", puteți alege și strategia de enumerare pas cu pas descrisă în Cap Când îl utilizați, spațiul necesar din memoria mașinii este șters periodic ca urmare a renunțării unora dintre arborii de căutare "ȘI/SAU" Se poate determina, de exemplu, care dintre arborii de decizie potențiali din arborele de enumerare are cel mai mare cost estimat Apoi se poate arunca periodic un anumit număr de arbori de decizie potențiali cei mai "scusitori" (cu riscul, desigur, ca arborele aruncat să fie partea superioară a arborelui de cost minim adevărat) Dacă metoda noastră urmează să fie folosită pentru a repeta peste grafice "ȘI/SAU" (mai degrabă decât arborii "ȘI/SAU"), atunci trebuie făcute modificări mai importante la algoritm În acest sens, este necesar să se țină seama de considerentele menționate la Sec PROCEDURA MINIMAX PENTRU CĂUTARE PE ARBORELE DE JOC În cap am văzut că arborii de joc pot fi reprezentați ca arbori "ȘI/SAU" Folosind aceasta, încercăm să demonstrăm că jucătorul PLUS poate câștiga dintr-o poziție de început a jocului Apoi pozițiile care apar după mutarea jucătorului PLUS sunt reprezentate prin vârfuri "SAU", iar pozițiile care apar după mutarea jucătorului MINUS sunt reprezentate prin vârfuri "ȘI" Vom presupune că PLUS merge primul și că PLUS și MINUS se alternează Prin urmare, copiii nodurilor "ȘI" vor fi vârfuri "SAU" și invers În conformitate cu ipoteza acceptată, vom considera că vârful inițial este vârful "ȘI" Vârful final corespunde oricărei poziții cunoscute a fi câștigătoare pentru jucătorul PLUS (Definiția vârfului final trebuie schimbată dacă scopul căutării este de a demonstra că PLUS poate realiza Procedura Minimax pentru enumerarea pe arbori de joc d un egal bazat pe o anumită poziție sau pe care un PLUS nu îl poate pierde într-o anumită poziție ) Pentru multe jocuri simple (precum și pentru finalurile jocurilor mai complexe), este posibil să se folosească forța brută a arborelui AND/OR, deoarece atunci dovada unei victorii (sau a unei remize) poate fi găsită fără a construi arbori mari de forță brută Apoi, arborele de decizie care dovedește o victorie (sau o remiză) oferă strategia completă de joc pentru jucătorul PLUS Exemple de jocuri simple în care pare realist să încerci arbori SI/SAU pentru a obține un răspuns sunt jocul lui Grundy din capitolul anterior, tic-tac-toe (tic-tac-toe), diverse variante ale nim și unele șah și jocurile finale de dame O estimare aproximativă a dimensiunii arborelui jocului pentru tick-tock-tou, de exemplu, poate fi obținută notând că vârful de pornire are copii, fiecare dintre care la rândul său are copii și așa mai departe, rezultând ! = de vârfuri în partea de jos a acestui arbore Cu toate acestea, multe căi se termină la vârfurile finale ale nivelurilor superioare și, în plus, se poate obține o reducere semnificativă a dimensiunii arborelui dacă se iau în considerare simetriile În cazul jocurilor mai complexe, cum ar fi un joc complet de șah sau dame, iterarea până la sfârșit pe arborii "ȘI/SAU" este exclusă Numărul de vârfuri din arborele complet de joc pentru dame a fost estimat la IO , iar pentru șah - IO (Ar fi nevoie de aproximativ de secole pentru a construi un arbore complet pentru dame, chiar presupunând că fiecare copil ia / dintr-o nanosecundă ) Procedurile de enumerare ordonată nu reduc factorul de ramificare suficient pentru a face o mare diferență Prin urmare, trebuie să ne resemnăm cu faptul că pentru jocurile complexe enumerarea exhaustivă este imposibilă, adică ar trebui să renunțăm la ideea de a dovedi că este posibil să obținem o victorie sau o egalitate (excluzând, poate, jocurile finale) În schimb, atunci când iterează prin arborii jocului, s-ar putea urmări să găsească doar o primă mișcare "bună" Am putea face această mișcare, să așteptăm răspunsul adversarului și din nou forța brută pentru a găsi o mișcare "bună" din noua poziție Enumerarea trebuie efectuată în același mod ca enumerarea obișnuită pe graficele "ȘI/SAU" Puteți utiliza fie căutare exhaustivă, căutare în profunzime, fie metode de căutare ordonată, dar condițiile de terminare trebuie acum modificate Puteți specifica mai multe condiții de terminare artificială pe baza unor factori precum limitele de timp de parcurgere, limitele de memorie sau adâncimea celui mai adânc nod frunză din arborele de căutare În plus, la șah, de exemplu, nu se termină Ch Metode de căutare pentru reducerea sarcinilor la subsarcini spargerea dacă vreunul dintre vârfurile finale reprezintă o poziție "în direct", de exemplu, o poziție în care nu există un schimb direct profitabil După ce enumerarea este finalizată, trebuie să extragem estimarea celei mai bune mișcări din arborele de enumerare Această estimare poate fi obținută prin aplicarea unei funcții de evaluare statică la nodurile finale ale arborelui de enumerare Funcția de scor măsoară "meritele" poziției corespunzătoare punctului final și se bazează pe diferitele elemente ale poziției despre care se crede că îi afectează meritul De exemplu, la dame, astfel de elemente utile sunt avansarea relativă a damelor proprii, controlul centrului tablei, controlul centrului tablei de către regi etc La analiza arborilor de joc, de obicei se adoptă un acord conform căruia în pozițiile de joc în care PLUS are un avantaj, funcția de evaluare este pozitivă, iar pentru pozițiile în care avantajul jucătorului este MINUS, funcția de evaluare este negativă Valorile apropiate de zero corespund pozițiilor de joc care nu oferă un avantaj niciunui dintre jucători O primă mișcare bună poate fi găsită folosind procedura minimax Presupunem că dacă jucătorul PLUS ar trebui să aleagă între vârfurile de capăt, l-ar alege pe cel cu cel mai mare scor Prin urmare, vârfului (tipul "ȘI"), care este părintele vârfurilor de capăt de tipul "SAU", i se atribuie o valoare de rezervă egală cu estimările maxime ale vârfurilor de capăt Pe de altă parte, dacă jucătorul ar trebui să aleagă MINUS între vârfurile de capăt, atunci probabil ar prefera să aleagă vârful care ar avea cea mai mică estimare (adică cea mai negativă) Prin urmare, vârfului (tipul "SAU"), care este părintele vârfurilor "ȘI" de sfârșit, i se atribuie o valoare inversată egală cu "estimările minime ale vârfurilor de capăt" Odată ce tuturor nodurilor părinte ale vârfurilor de sfârșit li s-au atribuit valori inversate, acest proces de "backtracking" este efectuat cu un nivel în sus, cu condiția ca PLUS să selecteze vârful cu cea mai mare valoare inversată, iar MINUS să selecteze vârful cu cea mai mică valoare inversată Acest backtracking continuă de la un nivel la altul până când valorile inversate în final sunt atribuite tuturor nodurilor care sunt copii ale vârfului de pornire Presupunem că, dacă prima mutare trebuie făcută de jucătorul PLUS (adică, copiii vârfului inițial sunt vârfuri "SAU"), atunci el trebuie să aleagă ca primă mutare mutarea corespunzătoare vârfului copil cu cea mai mare valoare a lui această valoare inversată Procedura Minimax pentru enumerarea pe arbori de joc Utilitatea întregii proceduri constă în faptul că valorile obținute prin trasarea scorurilor înapoi pentru vârfurile imediat următoare celei inițiale sunt considerate a fi măsuri mai fiabile ale meritului relativ al pozițiilor corespunzătoare decât cele care ar putea fi obținute prin aplicarea directă funcția de scor la aceste poziții În cele din urmă, aceste inversări se vor baza pe "priviți înainte" prin arborele jocului și astfel depind de caracteristicile care apar spre sfârșitul jocului Să ilustrăm metoda minimax cu un exemplu simplu folosind jocul tic-tac-toe Să presupunem că PLUS pune X-uri (X) și MINUS pune zerouri (O) și lasă PLUS-ul să treacă primul Vom itera până când toate vârfurile din nivelul au fost construite, apoi vom aplica funcția de evaluare statică pozițiilor corespunzătoare acelor vârfuri Fie ca funcția noastră de evaluare e(p) a poziției p să fie dată după cum urmează: Dacă p nu este o poziție câștigătoare, atunci e(p) = (numărul de rânduri, coloane sau diagonale întregi încă deschise jucătorului PLUS) - (numărul de rânduri, coloane sau diagonale întregi încă deschise jucătorului MINUS) Dacă poziția p este avantajoasă pentru jucătorul PLUS, atunci e(p) = oo (simbolul oo înseamnă un număr pozitiv foarte mare) Dacă poziția p este avantajoasă pentru jucătorul MINUS, atunci e(p)=-oo Despre X Deci, dacă p este , atunci e(p) = - = Pentru atunci când construim pozițiile copiilor, vom ține cont de simetrii Da, toate posturile X IO Ol X vom presupune identic (La începutul jocului, factorul de ramificare în jocul tic-tac-tou este mic din cauza simetriilor, iar la sfârșitul jocului este mic din cauza numărului mic de celule goale ) Pe fig Figura prezintă un arbore construit prin căutarea la adâncimea Sub nodurile de capăt, sunt afișate estimările lor statice, iar valorile obținute ca urmare a urmăririi sunt încercuite Deoarece Tineret Fig- Abordare Minimax în joc tick-tock-tou (prima etapă) procedura alfa beta poziție^ are valoarea inversată cu cel mai mare semn valoare se alege ca prima mutare (Apropo, aceasta se dovedește a fi cea mai bună mișcare pentru un jucător PLUS ) Să presupunem acum că PLUS face această mișcare și MI- NUS răspunde cu o poziție (Mișcare proastă pentru un jucător sărac ka MINUS, care, aparent, nu folosește o strategie de căutare bună ) Apoi, PLUS caută la o adâncime de ІІ (pornind de la poziție ), care duce la un copac marginea prezentată în fig PLUS face cea mai bună mișcare, iar MINUS face mutarea prin care evită înfrângerea imediată; rezultatul este o poziție PLUS apoi repetă din nou, rezultând merge la arborele prezentat în fig Unele dintre nodurile terminale ale acestui arbore (de exemplu, nodul D) reprezintă poziții în care MINUS câștigă și, prin urmare, au un scor de -su Privind înapoi la aceste scoruri, vedem că cea mai bună mișcare pentru jucătorul PLUS de aici este punctul, singura mutare care îi permite să evite înfrângerea imediată Acum chiar și MINUS poate vedea că PLUS trebuie să câștige la următoarea lui mișcare și, prin urmare, recunoaște cu demnitate PROCEDURA ALFA-BETA În procedura de enumerare tocmai descrisă, procesul de construire a arborelui de enumerare este complet separat de procesul de estimare a poziției Abia după finalizarea construcției arborelui începe evaluarea pozițiilor Se pare că această diviziune duce la o strategie foarte ineficientă Este posibil să se obțină o reducere semnificativă a cantității necesare de enumerare (uneori cu mai multe ordine de mărime) dacă evaluarea vârfurilor de capăt și calculul valorilor inversate sunt efectuate simultan cu construcția arborelui Luați în considerare arborele de enumerare prezentat în Fig (ultima etapă a enumerarii noastre în jocul tic-tac-too) Să presupunem că nodul final este evaluat de îndată ce este construit Apoi, după construirea și evaluarea vârfului A, nu există Orez Abordare Minimax în joc tick-tock-tou (etapa a doua) - • - = - = - = Orez Abordare Minimax în jocul tic-tac-too (etapa a treia) Ch Metode de căutare pentru reducerea sarcinilor la subsarcini nu are rost să construim (și să evaluăm) vârfurile B, C și D Într-adevăr, din moment ce jucătorul MINUS are la dispoziție poziția A și nu poate prefera nimic în locul acesteia, este clar că va alege exact A Atunci se poate atribuiți vârfului care precede A, valoarea inversată este oo și continuați enumerarea, salvând efortul de căutare asociat construcției și evaluării vârfurilor B, C și D (Rețineți că această economisire ar fi și mai semnificativă dacă enumerarea a fost efectuat la o adâncime mai mare, deoarece nu ar fi necesar să se construiască niciunul dintre vârfurile care urmează B, C și D ) Este important de reținut că faptul că vârfurile B, C și D nu sunt construite nu poate afecta în niciun fel mută pentru jucătorul PLUS cea mai bună prima mișcare În acest exemplu, economiile de costuri de pierdere se datorează câștigării poziției A pentru jucătorul MINUS Cu toate acestea, economii de același tip pot fi realizate chiar și atunci când niciuna dintre pozițiile din arborele de enumerare nu este câștigătoare nici pentru jucătorul PLUS, nici pentru jucătorul MINUS Luați în considerare arborele tick-tock-tou prezentat în Fig O parte din acest arbore este reprodusă în Fig Să presupunem că o căutare se face la o adâncime dată și, de îndată ce este construit un anumit vârf de capăt, se calculează estimarea sa statică Să presupunem, de asemenea, că de îndată ce o valoare inversată poate fi atribuită unei poziții, această valoare procedura alfa beta se calculează imediat Acum luați în considerare situația care apare în stadiul căutării în profunzime, când vârful A și vârfurile sale copil au fost deja construite, dar vârful B nu a fost încă construit Pentru vârful A, valoarea inversată este - Acum vârfului inițial i se poate atribui o valoare preliminară inversată (PRV) egală cu - În funcție de valorile inversate ale celorlalte vârfuri copil ale vârfului inițial, valoarea finală inversată a vârfului inițial poate deveni mai mare decât această valoare preliminară de - , dar nu poate deveni mai mică Să continuăm căutarea depth-first până când sunt construite nodul B și primul dintre nodurile sale copil, adică, C Vertexului C i se atribuie o valoare statică de - Vârfului B i se poate atribui o valoare preliminară inversată (PRV) de - În funcție de valorile statice ale celorlalte vârfuri copil ale vârfului B, valoarea finală inversată a vârfului B poate deveni mai mică decât - , dar nu poate deveni mai mare Rețineți că valoarea finală inversată a vârfului B nu poate depăși, prin urmare, SV a vârfului inițial și, prin urmare, este posibil să se încheie enumerarea sub vârful B Putem fi siguri că vârful B nu va fi preferabil vârfului A Această reducere a supraîncărcării de enumerare este realizată prin urmărirea inverselor anterioare În general, de îndată ce vârfurilor copil ale unui anumit vârf li se atribuie valori inversate, SOC-ul acestui vârf ar trebui reconsiderat Ar trebui luat în considerare faptul că ) SOV "ȘI" al vârfurilor (inclusiv vârful inițial) nu poate scădea ) SOV "OR" al vârfurilor nu poate crește Ținând cont de aceste observații, formulăm următoarele reguli pentru întreruperea enumerării: a) Enumerarea poate fi întreruptă sub orice vârf "SAU", al cărui POI nu este mai mare decât POI-ul oricărui vârf "ȘI" care îl precede (inclusiv vârful inițial) Acest vârf "SAU" i se poate atribui apoi SOV ca valoare finală inversată ) b) Enumerarea poate fi întreruptă sub orice vârf "ȘI", al cărui POI nu este mai mic decât POI-ul oricărui vârf "SAU" care îl precede Acest vârf "ȘI" poate fi apoi atribuit POV ca invers final >) Rețineți că această valoare inversată poate să nu fie "adevărată" pentru vârful său, dar este limita care duce la calculul corect al valorii inversate preliminare pentru vârful anterior dec O - - - - ^ O - - - - - - - O - - - - O - t Orez Un exemplu care ilustrează iterația alfa-beta + - + + + - - - + + + + -I - + - + - (□ - vârfuri de tip "ȘI", O - vârfuri de tip "OR") Eficiența enumerarii cu procedura alfa-beta În timpul căutării, SOC-urile sunt calculate după cum urmează: ) Se presupune că SOV pentru "ȘI" vârfului (inclusiv vârful inițial) este egal cu cea mai mare dintre valorile inversate disponibile în prezent ale vârfurilor sale copil ) Se presupune că SOV pentru vârful "OR" este egal cu cea mai mică dintre valorile inversate disponibile în prezent ale vârfurilor sale copil De obicei, SOV pentru nodurile "ȘI" se numește valori alfa, iar SOV pentru nodurile "SAU" se numește valori beta Dacă enumerarea este întreruptă conform regulii (a), atunci se spune că are loc tăierea alfa, iar dacă conform regulii (b), atunci se spune că are loc tăierea beta Întregul proces de urmărire a SOV-urilor și de efectuare a tăierii atunci când este posibil este denumit în mod obișnuit procedura alfa-beta Procedura se termină atunci când tuturor nodurilor copil pentru vârful inițial li s-au atribuit valori finale inversate Atunci cea mai bună mișcare este cea care duce la nodul copil cu cea mai mare valoare inversată Rețineți că această procedură duce întotdeauna la aceeași cea mai bună mișcare ca și metoda minimax simplă de aceeași adâncime Singura diferență este că procedura alfa-beta găsește de obicei această primă mișcare cea mai bună după repetarea pe un volum mult mai mic Aplicarea procedurii alfa-beta este ilustrată în arborele prezentat în Fig Acesta este un arbore de căutare construit la o adâncime de (Pentru comoditate, vârfurile "ȘI" sunt afișate ca pătrate, iar vârfurile "SAU" sunt afișate ca cercuri ) Nodurile de sfârșit au valorile statice specificate Să presupunem că repetăm folosind o procedură alfa-beta (Suntem din nou de acord să construim mai întâi vârfurile situate în stânga ) Subarborele rezultat din procedura alfa-beta este afișat în linii aldine Vârfurile trunchiate sunt tăiate Rețineți că doar dintre ele au trebuit evaluate de vârfuri originale Cititorul poate folosi acest exemplu pentru a verifica înțelegerea sensului procedurii alfa-beta încercând să repete enumerarea EFICIENȚA CĂUTĂRII ÎN PROCEDURA ALPHA-BETA Pentru ca tăierea să aibă loc, cel puțin o porțiune din arborele de iterație trebuie construită la adâncimea maximă, deoarece valorile inversate preliminare trebuie să se bazeze pe valorile statice ale punctelor finale Prin urmare, atunci când se utilizează proceduri alfa-beta, se recurge de obicei la unul sau altul tip de căutare în profunzime Numărul de tăieturi posibile în procesul de enumerare depinde de gradul în care primul preliminar Ch Metode de căutare pentru reducerea sarcinilor la subsarcini mărimile aproximează mărimile finale inversate Valoarea finală inversată pentru vârful de început este aceeași cu valoarea statică a unuia dintre vârfurile de sfârșit Dacă acest vârf poate fi atins mai întâi la căutarea în profunzime, atunci numărul de tăieturi va fi maxim Cu numărul maxim de tăieturi, este necesar să se construiască și să se evalueze numărul minim de vârfuri de capăt Fie arborele să aibă adâncimea D și fiecare vârf (cu excepția celui terminal) are exact B vârfuri copil Un astfel de arbore va avea exact vârfuri terminale BD Să presupunem că, în procedura alpha-beta, nodurile copil sunt construite în ordinea corespunzătoare cu adevăratele lor valori inversate: pentru nodurile "SAU", sunt construite nodurile copil cu cele mai mari valori, iar pentru "ȘI" vârfuri, nodurile copil cu cele mai mici (Desigur, aceste inversări nu sunt de obicei cunoscute în momentul în care copiii sunt construiți, așa că această ordine nu este niciodată atinsă, decât întâmplător ) Se pare că această ordine maximizează numărul de tăieturi și minimizează numărul de vârfuri de capăt construite Notați acest număr minim de vârfuri de capăt cu ND Se poate arăta că g B°/ - = | fl(D+l)/ £J(Dl)/ pentru D par, pentru D impar Cu alte cuvinte, numărul de vârfuri de capăt de adâncimea D care vor fi construite cu căutarea optimă alfa-beta este aproximativ egal cu numărul de vârfuri de capăt care ar fi construite la adâncimea D/ fără procedura alfa-beta Astfel, cu aceleași cerințe de memorie, procedura alpha-beta cu ordonarea perfectă a nodurilor copil vă permite să dublați adâncimea de căutare Desigur, este imposibil să obținem o ordonare perfectă în problemele de enumerare (dacă ar fi posibil, nu am avea nevoie de niciun proces de sortare!), dar este important să folosim cea mai bună funcție de ordonare pe care o avem la dispoziție, deoarece aceasta are un potențial mare beneficii PROCEDURI COMBINATE ALPHA-BETA ȘI PROCEDURI DE COMANDARE Două proceduri pentru construirea nodurilor copil vin imediat în minte în secvența care este evaluată ca fiind cea mai bună Proceduri combinate Comandă fixă Este posibil să se utilizeze o căutare depth-first, în care, în primul rând, este construit un nod copil, care este evaluat ca fiind cea mai bună mișcare (pentru orice jucător) Vom spune că o astfel de procedură folosește o ordonare fixă Deci, dacă, să zicem, vârful este evaluat ca cel mai bun dintre nodurile copil ale vârfului inițial (din punctul de vedere al jucătorului PLUS), atunci acesta este construit în continuare și este ales și pentru următoarea expansiune Apoi, dacă, să zicem, vârful este evaluat ca cel mai bun dintre vârfurile copil ale vârfului (din punctul de vedere al jucătorului MINUS), atunci acesta este construit în continuare și este selectat pentru extindere Acest proces continuă până când se ajunge la vârful final, moment în care decupările devin posibile Căutarea în profunzime (folosind procedura alfa-beta) continuă în mod obișnuit, iar construcția vârfurilor se realizează în continuare în ordinea valorii lor estimate Valoarea unui vârf poate fi evaluată în diferite moduri Pentru a clasa nodurile copil, puteți folosi funcția de scoring în sine, sau poate o funcție de scor mai simplă (și mai puțin fiabilă) Pe de altă parte, sub fiecare dintre nodurile copil, este posibil să se efectueze o enumerare mai puțin profundă și apoi să se ordoneze vârfurile copil, pe baza valorilor lor inverse obținute ca urmare a unei astfel de enumerări superficiale fiecare dintre aceste metode, ar trebui comparate costurile suplimentare de enumerare asociate comenzii, cu economia care vine odată cu creșterea numărului de tăieturi în arborele de enumerare De obicei, pentru a alege raportul corect între acești factori, trebuie să faceți un experiment Comandă dinamică Avantajul procedurii alfa-beta de comandă fixă descrisă este că este destul de simplă Dar se poate întâmpla ca în cursul unei enumerari de-a lungul unui anumit drum în arborele de enumerare, să devină evident că această enumerare ar trebui continuată, pornind de la un vârf mai înalt, care acum este mai eficient Se va putea enumera în acea parte a arborelui care pare a fi cea mai promițătoare până la atingerea adâncimii maxime, se va putea modifica ușor algoritmul de enumerare ordonată pe arbori SI/SAU Vom spune că algoritmul de enumerare ordonată modificat utilizează ordonarea dinamică în acest caz Ch Metode de căutare pentru reducerea sarcinilor la subsarcini Schimbările sunt destul de simple La fiecare pas al procesului de iterație, vor exista noduri de sfârșit în arborele de iterație În loc să numărăm valorile H pentru aceste vârfuri (măsurând costul estimat), putem folosi o funcție de evaluare e pentru a măsura valoarea pozițiilor corespunzătoare din joc Apoi, prin analogie cu numărarea valorilor fi, valorile inverse sau valorile (Rețineți că costurile arcurilor dintr-un arbore de joc de obicei nu sunt specificate; prin urmare, valorile inversate vor fi calculate exact în același mod ca în procedura minimax ) Pe baza valorilor e inversate, în arbore este selectat un lanț cu cele mai bune mișcări care conduc la unul dintre vârfurile sale finale Acest vârf este dezvăluit în rândul următor (Cea mai bună mișcare sub partea de sus ar fi să alegeți copilul OR din partea de sus cu cea mai mare valoare e inversată; cea mai bună mișcare sub partea de sus OR ar fi să alegeți copilul și din partea de sus cu cea mai mică valoare e inversă ) Când se atinge în cele din urmă valoarea e maximă, avem posibilitatea de a calcula valorile inversate preliminare, iar apoi putem începe să căutăm posibile limite (Tăierea este similară cu eliminarea vârfurilor din lista OPEN în pașii ( ) și ( ) ai algoritmului de enumerare ordonată (pag , ) ) Din nou, se pot evalua meritele poziției corespunzătoare acestui nod final al arborelui de enumerare folosind o funcție de evaluare statică sau printr-o enumerare superficială De asemenea, se poate presupune că înainte de a se face calculele asociate cu obținerea unui nou arbore, atunci, sub vârful ales pentru dezvăluire, crește o bucată întreagă din arbore Într-o serie de experimente (Slagel și Dixon, ) pe exemplul jocului kalah ) s-a arătat că metoda alfa-beta, folosind un anumit tip de ordonare dinamică, este mai eficientă decât procedura alfa-beta cu un ordonare sau (în mod firesc) în comparație cu o procedură minimax simplă fără alfa-beta POSIBILĂ ÎMBUNĂTĂȚIRE A METODELOR BAZATE PE MINIMAX Filosofia de bază din spatele metodelor minimax (inclusiv cele care folosesc alpha-beta) este că cea mai bună mișcare a jucătorului MINUS este determinată de iterația efectuată de jucătorul PLUS Dacă presupunem că ■) Jocul kalah este descris în detaliu în jurnalul Nauka i Zhizn, nr , - , Există, de asemenea, o descriere (populară) a mai multor programe de calculator pentru acest joc - Notă, trad Note bibliografice și istorice posibilitățile de revendicare ale jucătorului MINUS sunt aceleași cu cele ale jucătorului PLUS; apoi, de fapt, va fi căutat cu un nivel mai adânc decât căutarea efectuată în arborele de căutare de către jucătorul PLUS Astfel, după forțele brute ale jucătorului MINUS, acesta își poate alege răspunsul pe baza unor valori inversate mai fiabile decât cele calculate de jucătorul PLUS Prin urmare, cea mai bună mișcare a jucătorului MINUS nu se va potrivi cu cea mai bună mișcare pe care jucătorul PLUS a obținut-o mai devreme Această situație poate fi corectată prin modificarea ușoară a metodei minimax pentru construirea cantităților inversate În loc să luăm ca inversare cea mai mare (sau cea mai mică) dintre valorile nodurilor copil, putem lua o funcție mai complexă a acestor valori De exemplu, s-a propus să se adauge o valoare fixă la valoarea inversată pentru vârful "ȘI", dacă mai multe dintre vârfurile "SAU" au cea mai mare valoare În mod similar, această valoare fixă a fost propusă să fie scăzută din valorile "SAU" ale vârfurilor, dacă vârful "ȘI" are mai mult de un vârf "bun" (pentru jucătorul MINUS) Aceasta strategie de adaugare sau scadere a unei anumite sume iti permite sa evidentiezi avantajele suplimentare ale pozitiei, din care poti face cateva miscari bune Experimentele testate cu această strategie (Slagel și Dixon, ) arată că într-adevăr duce la un joc mai bun, cel puțin în cazul jocului kalah NOTE BIBLIOGRAFICE SI ISTORICE Dezvoltarea metodelor de enumerare pe grafice "ȘI/SAU" Strategiile de căutare ale majorității programelor timpurii care au creat arbori de subsarcini au folosit doar tehnici simple de ordonare În primele versiuni ale solutorului universal de probleme s-a folosit o strategie de căutare în profunzime și au fost implicate instrumente de estimare a dificultății problemelor; backtracking a fost efectuat atunci când o sarcină copil părea mai complexă decât unul dintre predecesorii săi În programul SAINT al lui Slagel, "adâncimea integrandului" este introdusă ca măsură a dificultății problemei și, de obicei, cea mai ușoară și? sarcini În anii , Slagel și colaboratorii săi au făcut o mulțime de experimente cu diferite strategii de iterație pentru arbori de joc și arbori AND/OR Pentru o prezentare generală a strategiilor pentru arbori de joc, a se vedea Slagel și Dixon ( ) Cea mai complexă dintre aceste strategii folosește ordonarea dinamică a expansiunii vârfurilor programul lui Slagel şi Ch Metode de căutare pentru reducerea sarcinilor la subsarcini Bursky ( ), numit MULTIPLE (MULTIpurpose Program that LEarns), include o strategie universală de iterare peste grafice "ȘI/SAU" Această strategie folosește conceptul de "probabilitate ca o presupunere să fie adevărată" și apoi definește o "funcție de calitate" dată pe setul de vârfuri deschise de arbore Vârful care are cea mai mare influență asupra probabilității ca estimarea inițială să fie corectă se spune că are cea mai înaltă "calitate" Acesta din urmă este ales pentru dezvăluire Amarel ( ) a propus o strategie de "control al atenției" pentru a eficientiza procesul de dezvăluire într-un arbore "ȘI/SAU" Această strategie se referă la încercarea de a găsi o soluție de cost minim Autorul acestei cărți (Nilson, ) a propus și o strategie de minimizare a costurilor și mai târziu și-a dat seama că era în esență aceeași cu strategia lui Amarel Nilson ( ) demonstrează că această strategie într-adevăr permite găsirea unor soluții de cost minim Această demonstrație, precum și demonstrația dată în acest capitol, este similară cu cea a lui Hart, Nilson și Raphael ( ) pentru graficele spațiului de stare Strategia Amarel-Nilson diferă puțin de metoda de ordonare dinamică a lui Slagel și Dixon Descrierea algoritmului de căutare ordonată dată în acest capitol este doar o încercare de a oferi o idee destul de clară și generală a acestei strategii de bază Dezvoltarea metodelor de enumerare pe arbori de joc Claude Shannon ( ) a luat în considerare unele dintre problemele implicate în scrierea de programe pentru o mașină care joacă jocuri complexe precum șahul El a propus utilizarea unei proceduri de căutare minimax împreună cu o funcție de evaluare statică Newell, Shaw și Simon ( ) și-au folosit ideile pentru a construi primele programe de șah Ei au, de asemenea, o imagine de ansamblu excelentă asupra acestui domeniu de cercetare Discuții suplimentare despre programele de șah împreună cu un "plan de lucru pe cinci ani" în domeniul șahului automat pot fi găsite într-un articol al lui Good ( ), care conține și câteva referințe În , Samuel a descris un program de dame care folosea funcții de evaluare polinomială, metode de enumerare minimax și diverse strategii de "învățare" pentru a îmbunătăți jocul ) - Programul lui Samuel ■) Samuel a remarcat mai târziu (comunicare privată) că programul său folosește și procedura alfa-beta, dar la momentul respectiv a considerat că utilizarea acesteia era prea evidentă pentru a merita inclusă în lucrare Note bibliografice și istorice joacă genial la dame și câștigă împotriva tuturor, cu excepția jucătorilor foarte puternici Rămâne în continuare unul dintre cele mai bune exemple de aplicare a metodelor de inteligență artificială Lucrări suplimentare asupra acestui program sunt descrise în Samuel ( ) Una dintre caracteristicile celor mai recente versiuni ale programului lui Samuel este ordonarea dinamică a procedurii de enumerare, oarecum asemănătoare cu ordonarea lui Slagle și Dixon ( ) Procedura alfa-beta pare de obicei a fi o dezvoltare destul de evidentă a abordării minimax și, prin urmare, a fost "descoperită" în mod independent de un număr de cercetători A fost descris pentru prima dată de Newell, Shaw și Simon ( ) și a făcut obiectul unui studiu amplu de către McCarthy și studenții săi (Edwards și Hart, ) la Institutul de Tehnologie din Massachusetts Există mai multe expuneri clare ale acestei metode și proprietățile sale O bună descriere a acestuia poate fi găsită în cea de-a doua lucrare a lui Samuel ( ) despre jocul damelor, precum și a lui Slagel și Dixon ( ) Rezultatele privind eficiența enumerarii în procedura alfa-beta au fost stabilite pentru prima dată de Edwards și Hart ( ) pe baza unei teoreme pe care o atribuie lui Michael Levin Mai târziu, Slagel și Dixon ( ) au dat ceea ce ei consideră a fi prima demonstrație publicată a acestei teoreme Ei au luat în considerare mai multe opțiuni pentru procedura alfa-beta, inclusiv (cea mai bună opțiune) folosind ordonarea dinamică Compararea lucrărilor acestor strategii diferite a fost efectuată pe exemplul vechiului joc al kalah Studiul nostru asupra posibilelor îmbunătățiri ale metodelor bazate pe minimax provine din unele sugestii ale lui Slagel ( ) și Slagel și Dixon ( ) Ultimul articol descrie experimente cu programul M&N Iterative Tree, care adaugă (sau scade) o valoare fixă la calculul valorilor inversate Câteva programe de joc caracteristice Şah Kister și colaboratorii ( ) au descris primul sistem de șah programat pe calculator (MANIAC I la Los Alamos) Ea folosește o tablă mai mică ( X ) și jocul ei pare destul de slab Bernstein și colaboratorii ( ) au descris un sistem de șah programat pe o mașină IBM De asemenea, joacă destul de prost, dar pe o tablă de dimensiuni obișnuite ( X ) Newell, Shaw și Simon ( ) au dat un alt exemplu de program timpuriu de șah dezvoltat la Carnegie Ch Metode de căutare pentru reducerea sarcinilor la subsarcini Kotok ( ) a schițat prima versiune a unui program întocmit la MIT, care a fost ulterior dus de McCarthy la Stanford și ușor modificat Ajunge deja la nivelul de a juca un jucător mediocru G M Adelson-Velsky și alții (nu avem munca lor la dispoziție )) au scris un program la Institutul de Fizică Teoretică și Experimentală (Moscova) Acest program a învins programul Kotoka-McCarthy în turneu (Vezi Buletinul informativ SIGART, nr (iunie ), p ) Greenblatt și colaboratorii ( ) au descris un program compilat la Massachusetts Institute of Technology acum numit Mack Hack Nivelul jocului ei poate fi descris ca fiind nivelul de "amator mediu" Ea este membru de onoare al Societății de șah din Massachusetts și a fost distinsă la categoria C Alte exemple de jocuri sunt conținute în următoarele numere ale Buletinului informativ SIGART, nr că aparatul este în general capabil să învingă un jucător amator); Nr (aprilie ), p - , Nr (aprilie ), p - ; Nr (iunie ), p - dame Samuel ( , ) continuă să perfecționeze un program care joacă dame grozave, dar nu poate învinge campionul mondial Kalah* ) Primul program pentru acest joc a fost scris de Russell ( ) Slagel și Dixon ( ) au descris experimente folosind jocul kalah și ( ) rezultatele experimentelor în care kalah este folosit pentru a testa "procedura M&N" (Aparent, în jocul kalah, o persoană este incapabilă să bată o mașinărie ) gou Zobrist ( ) a scris un program pentru a juca vechiul și dificil joc de go Din punct de vedere uman, acest program joacă destul de prost și nu traversează arborele Exemple de funcționare a programului Zobrist găsiți în Buletinul informativ SIGART, nr (octombrie ), pp - Sarcini Prin inducție în Lema , am obținut o demonstrație pentru cazul în care copiii vârfului inițial sunt vârfuri "SAU" și am observat că un raționament similar poate fi aplicat și atunci când ') Vezi articolul lui Adelson-Velsky et al , UMN, , nr ( ), ( ) -" Notă, trad ) Vezi nota traducătorului de la pagina - Notă, trad Sarcini când vârfurile copil sunt vârfuri "ȘI" Dați o demonstrație pentru acest caz, completând astfel demonstrația Lemei (Pentru jucătorii de șah ) Luați un joc final de șah (de exemplu, din secțiunea de șah a unui ziar) și rezolvați-l prin construirea unui arbore de joc complet Desenați acest arbore de iterație, listând toate mișcările pe care le-ați luat în considerare și marcați "ȘI/SAU" subarborele de decizie Ce euristică specifică de șah ați folosit când ați construit arborele de iterație? * Construiți un algoritm de căutare ordonată pentru graficele "ȘI/SAU" (prin generalizarea algoritmului corespunzător pentru arbori descris în Secțiunea ) Efectuați o căutare alpha-beta în arborele de joc prezentat în Fig , construind mai întâi vârfurile din dreapta Indicați unde se fac tăieturile și comparați cu fig , pe care au fost construite primele vârfuri din stânga * (Pentru programatorii LISP ) Scrieți o funcție LISP SEARCH(START, DEPTH) care construiește un arbore de joc folosind un generator de mișcări legale, până la o adâncime maximă DEPTH (Să presupunem că jucătorul PLUS se mișcă în poziția START și apoi se mișcă alternativ ) Funcția SEARCH trebuie să aplice funcția de evaluare statică VAL (POZIȚIE) nodurilor cu o adâncime egală cu DEPTH și să efectueze o căutare alpha-beta pentru a găsi cea mai bună mișcare în pozițiile START Valoarea CĂUTARE trebuie să fie o listă de formă (BPOZIȚIE, VALOARE), unde BPOZIȚIE este cea mai bună poziție a copilului (față de START) și VALOARE este valoarea inversată pentru jucătorul PLUS * Scrieți un program pentru computer pentru a juca un joc tridimensional de tic-tac (uneori numit Cube) Acest joc este jucat de doi sau mai mulți jucători pe un cub X X împărțit în de spații Fiecare jucător plasează pe rând una dintre pictogramele sale într-una dintre celulele libere Primul jucător care reușește să încadreze patru dintre pictogramele lor în același rând, coloană sau diagonală a oricăruia dintre planurile cubului sau de-a lungul oricăreia dintre diagonalele principale ale cubului, câștigă Programul poate folosi orice strategie rezonabilă de iterație, dar ar trebui să folosească și unele euristice pentru a limita numărul de poziții copil construite în arborele jocului Pentru a acoperi jocurile de n persoane, n , trebuie să generalizăm conceptele de arbore de joc și enumerare pe un arbore de joc Capitolul DOVADA TEOREMELOR ÎN CALCULUL PREDICATULUI CALCULUL PREDICATULUI CA LIMBAJ DE REZOLVARE A PROBLEMELOR Am notat în cap că o analiză logică poate fi necesară pentru a rezolva multe probleme Raționamentul logic automat necesită un limbaj formal în care să formulezi premise și să tragi concluzii logice corecte Tot ceea ce este necesar pentru aceasta este capacitatea de a descrie problema care ne interesează și mijloacele de a găsi pașii corespunzători în procesul de inferență Calculul predicatului de ordinul întâi este un sistem logic în care poate fi exprimat o mare parte din ceea ce este relevant pentru matematică, precum și o mare parte din limbajul vorbit Acest sistem conține reguli de inferență logică care permit să se facă construcții logice corecte ale noilor declarații bazate pe un anumit set de enunțuri Datorită generalității și puterii sale logice, calculul predicat poate pretinde serios că este folosit pentru inferența mașinii În acest capitol, ne vom îndepărta pentru un moment de scopul nostru principal de a studia procesele decizionale și vom oferi o privire de ansamblu asupra teoriei calculului predicat și tehnicilor de deducție din acest sistem, bazată pe principiul rezoluțiilor ) În cap vom reveni la subiectul rezolvării problemelor și vom da exemple care ilustrează problemele În cele din urmă, în cap vom explica funcționarea unora dintre cele mai eficiente modalități de a găsi concluziile logice necesare Un limbaj, ca cel din calculul predicatului, este definit de sintaxa sa Pentru a specifica sintaxa, trebuie să specificați alfabetul de caractere care va fi folosit în această limbă și regulile de conectare a acestor caractere între ele în expresii care sunt valabile în această limbă Una dintre clasele importante de expresii din calculul predicatului este clasa formulelor bine formate (formule a p ) De obicei folosim limbajul pentru a face declarații despre domeniul nostru de interes Relația dintre o limbă și domeniul pe care îl descrie este determinată de semantica acelui limbaj Formulele P P ale calculului predicatului sunt tocmai acele expresii pe care le vom studia ') Se folosește și termenul "rezoluție", care ni se pare a fi o traducere rusă mai puțin reușită a rezoluției în limba engleză - Notă, trad Sintaxă utilizați ca declarații referitoare la domeniul de interes pentru noi Se spune că formulele pp iau valoarea T sau 'F, în funcţie de faptul că aceste afirmaţii din această zonă sunt adevărate sau false Tehnicile de tratare a formulelor p p permit să tragem inferențe legate de o anumită zonă și, prin urmare, pot fi de interes în crearea proceselor de luare a deciziilor care necesită o astfel de inferență În secțiunea următoare, vom defini sintaxa pentru una dintre variantele de calcul predicat Apoi arătăm cum se pot face afirmații în acest limbaj despre domeniul pe care îl descrie SINTAXĂ Sintaxa calculului nostru de predicate include specificarea unui alfabet de simboluri și definirea diferitelor expresii utile care pot fi construite din aceste simboluri Pentru a explica ideile principale, vom începe prin a introduce un sistem comparativ • primitiv ) Apoi adăugăm alte simboluri acestui alfabet, permițându-ne să scriem unele dintre expresii mai scurte Alfabetul de bază este format din următoarele seturi de caractere: Semne de punctuație: , ( ) Simboluri logice: ~ ==> (Simbolul ~ este citit ca "nu", iar simbolul ==> ca "implica" ) Literele de funcție n-loc: f" (r ^ l, n ^ O) se numesc litere constante Pentru ușurința notării, este convenabil să folosiți litere mici a, b, c în loc de altele și litere mici f , g, h în loc de altele fără indici )* ) n-loc litere predicate: p? n^O) (P°{ se numesc litere propoziționale Le-am inclus pentru a fi complet, dar nu le folosim în exemplele următoare Pentru ușurința notării, în loc de p" este convenabil să folosiți majuscule P, Q, P fără subindice ) Aceste simboluri pot fi folosite pentru a construi diferite expresii Clasele de expresie care ne interesează pot fi definite recursiv după cum urmează: *) Mai precis, excludem temporar cuantificatorii și variabilele din considerare ) Cititorul se poate întreba de ce nu am construit imediat definiții folosind literele a, b, c, f, g, h Motivul este că avem nevoie de definițiile noastre formale să fie valabile pentru seturi arbitrar mari de litere funcționale, cum ar fi b, c, f, g, h} cap Demonstrarea teoremelor în calculul predicatelor Condiții a) Fiecare literă constantă este un termen b) Dacă h, tn (n > ) sunt termeni, atunci tn} termi c) Nicio altă expresie nu este termeni (Rețineți că dacă expresia g(ti, t , tn) este folosită ca termen, atunci este folosită în loc de t /") pentru unele rogo i Un superscript pe g ar fi redundant ) Formule atomice a) Literele propoziționale sunt formule atomice b) Dacă ti, t , tn (u > ) sunt termeni, atunci t tn)- formula atomica c) Nicio altă expresie nu este formule atomice Formule bine formate (formule p p ) a) O formulă atomică este o formulă a p b) Dacă A este o formulă a p , atunci (~A) este o formulă a p c) Dacă A și B sunt formule a p , atunci (A=>B) este, de asemenea, o formulă a p d) Nicio altă expresie nu este formule pp (încă) Să dăm exemple de formule a p ): ~P(a,g(a,b,a)), P(a,b)^(~Q(c)), (~(P(a)=$P(b)))^P(b) , ~P(a)^Q(f(a)) Iată exemple de expresii care nu sunt formule pp: Q(f(a), (P(&)=>Q(c))) Să adăugăm la alfabetul nostru simbolurile logice A ("și") și V ("sau"), ceea ce ne va permite să scriem formule p p mai complexe care conțin ~ și =f Fie A\ și X oricare două formule a p Atunci X{XX și XIVX sunt, de asemenea, formule bine formate definite de egalități XiLX =~(Xi^~X ), X^X^^X^X, ') Dacă acest lucru nu poate duce la o neînțelegere, parantezele vor fi omise Semantică SEMANTICĂ Pentru a da unei formule pp o formulă "conținătoare", aceasta trebuie interpretată ca o afirmație referitoare la zona luată în considerare Pentru noi, un set nevide (posibil infinit) poate servi drept regiune Poate fi mulțimea numerelor întregi, sau mulțimea tuturor configurațiilor jocului de opt, sau mulțimea tuturor matematicienilor etc Afirmațiile care ne interesează vor fi legate de relațiile dintre elementele acestei zone De exemplu, am putea dori să facem afirmația "John este tatăl lui Bill" Atunci zona va fi un set de oameni, iar relația dintre oameni va fi relația binară de "paternitate" De asemenea, este util să aveți funcții în acest domeniu Dacă D este o regiune, atunci funcția n-locală atribuie fiecărui set de n elemente ale regiunii D un element din această regiune Astfel, funcția plus mapează perechi de numere întregi cu numere întregi în conformitate cu binecunoscuta operație de adunare Sunt aceste aspecte ale unui domeniu - elementele sale, funcțiile și relațiile sale - despre care vrem să vorbim în limbajul nostru de calcul predicat Pentru a face o afirmație a unui anumit sens pentru o formulă a p , asociem cu această formulă a p un domeniu nevid D și apoi cu fiecare simbol constant într-o formulă a p , un element specific din D; cu fiecare literă de funcție într-o formulă a p , o funcție concretă pe D ("-literele funcției locale corespund "funcțiilor -locale); cu fiecare literă de predicat din această formulă a p , o relație particulară între elementele lui D ("-literele predicatelor locale corespund "relațiilor -locale") Concretizarea domeniului și a corespondențelor indicate dă o interpretare, sau un model, formulei noastre a p Având în vedere o formulă a p și o anumită interpretare, fiecărei formule atomice din acea formulă a p i se atribuie o valoare T sau F Aceste valori pot fi apoi utilizate pentru a atribui o valoare a T sau F întregii formule a p Regula de atribuire a unei valori unei formule atomice este foarte simplă: dacă termenii literei predicatului corespund elementelor din D care satisfac relația corespunzătoare, atunci valoarea formulei atomice va fi T, în caz contrar va fi F Luați în considerare, ca exemplu, formula atomică Ch Demonstrarea teoremelor în calculul predicatelor si urmatoarea interpretare: D este mulțimea numerelor întregi, a este numărul , b este numărul , c este numărul , f este funcția de adunare, P este relația "mai mare decât" Sub această interpretare, formula noastră atomică afirmă că "numărul este mai mare decât suma numerelor și " Această afirmație este falsă, deci P(a, f(b, c)) este F Dacă interpretarea este schimbată astfel încât a devine numărul , atunci P(a, f(b, c)) va fi T Evident , că există multe alte interpretări pentru care această formulă atomică are valoarea T și multe astfel de interpretări pentru care are valoarea F, dar pentru orice interpretare va exista fie T, fie F și niciodată ambele în același timp Valoarea unei formule non-atomice p p poate fi calculată în mod recurent, pe baza valorilor formulelor sale constitutive Acest calcul folosește următoarele reguli: Dacă Xi este o formulă ip, atunci ~Xi este T când Xi este F și ~Xi este F când Xi este T Dacă Xi și X sunt oricare două formule p p , atunci valorile (A^VXr), (XiAX ) și (Xi=$>X ) sunt date de următorul tabel de adevăr: X X, х,ѵх, Х ЛХі T T T T T F T T F T T F T FF FFFF T Această metodă de calcul se numește metoda tabelului de adevăr Cu o interpretare dată, pentru o anumită a p a unei formule (și astfel pentru valorile date ale fiecărei formule atomice conținute în ea), este întotdeauna posibil să se calculeze valoarea (T sau F) acelui a p a formulei folosind o tabelul de adevăr Dacă valoarea unei formule a p într-o interpretare dată este T, atunci spunem că această interpretare satisface formula a p indicată (sau satisface formula a p specificată) Formula non-atomică p p și semnificația ei sunt folosite pentru a determina Variabile și cuantificatori împărțirea unei noi relații între elementele lui D: o formulă a p face o afirmație despre elementele lui D care este adevărată atunci când valoarea acestei formule a p este T VARIABILE ȘI CANTATIATORI Luați în considerare formula a p P (a, b) si interpretare D este o mulțime finită de numere întregi , , , , , a - numărul , b este numărul , P - raportul " mai mare sau egal cu" Cu această interpretare a p p , formula prevede că " este mai mare sau egal cu " Această afirmație este în mod evident adevărată, iar formula noastră ap sub această interpretare are valoarea T Să presupunem că, având același domeniu, atribuim valorile , , , literelor constante f%, • • • > fioo respectiv Cu fiecare dintre aceste litere, se poate construi o formulă ap de formă p m)- Mai mult, fiecare dintre formulele pp sub această interpretare are valoarea T Este adesea necesar să se facă o declarație specifică referitoare la fiecare element dintr-o anumită zonă O astfel de afirmație s-ar putea face sub forma unei conjuncții *) de formule a p , afirmația fiecăreia dintre ele vizează unul dintre elemente În exemplul de mai sus, formula p p P(fî /î)Af(fS /î)A ■■■ AP(f"" fî) afirmă că "fiecare număr întreg de la la este mai mare sau egal cu " Întrucât fiecare formulă a p (P^°, f°) are valoarea T, stabilim cu ajutorul tabelelor de adevăr că această conjuncție are și valoarea T Utilizarea conjuncțiilor mari pentru a exprima enunțuri care conțin cuvintele "toate" sau "pentru toate" ar duce la expresii excesiv de greoaie Pentru notarea lor prescurtată, introducem în limba noastră simbolul V (sens pentru toți) și variabilele individuale Xi (i ) (Uneori, în loc de x • • • sunt elemente ale regiunii D Conform tabelului de adevăr, această formulă bine formată are valoarea T, * V ') Disjuncția a p formulele X , Xn se numește a p formula Xi V L V VX" Valabilitate și fezabilitate când afirmația "cel puțin un element al lui D are proprietatea Q" este adevărată În locul disjuncțiilor care menționează fiecare element al regiunii, se folosesc simbolul și variabila corespunzătoare Apoi devine disjuncția de mai sus ( x)Q(x) Simbolul (există) se numește cuantificator existențial, iar variabila imediat următoare simbolului > se numește variabila care se referă la cuantificatorul existențial Când o astfel de variabilă apare în sfera unui cuantificator , se spune că aparține cuantificatorului existențial și, de asemenea, este legată de acel cuantificator Cu ajutorul tabelelor de adevăr (pentru regiuni finite) se poate demonstra că valoarea de adevăr a formulei ap ~(Vx)U (x) coincide întotdeauna cu valoarea de adevăr a formulei ap ( x) {~ W(x) } În mod similar, ~H(x)C (x) și (Vx){~C (x)} sunt echivalente Vom presupune că aceste relații sunt echivalente și în domenii nemărginite Când cuantificatorii universali și existențiali sunt combinați, acțiunea cuantificatorului existențial se poate dovedi a fi "dependentă" de unii cuantificatori universali anteriori Deci, afirmația "pentru orice număr întreg există un număr întreg mai mare" poate fi scrisă ca (Vx)(Ey)P(y,x) Evident, dacă această formulă a p trebuie să aibă valoarea T, atunci variabila y care "există" trebuie să depindă de x În formulele p p care constau din mai multe litere de predicat, vom folosi acolade pentru a desemna domeniul de aplicare al cuantificatorilor Astfel, (Vx){} înseamnă că orice variabilă x care apare în acele acolade este un cuantificator universal VALIDITATE ȘI FEZBILITATE Dacă o formulă pp are valoarea T pentru toate interpretările, atunci se numește validă Astfel, conform tabelului de adevăr, formula P(a)=^(P(a) V P(b)) are valoarea T sub orice interpretare și, prin urmare, este general valabilă Cu ajutorul tabelelor de adevăr, este întotdeauna posibil să se determine dacă o formulă pp dată care nu conține cuantificatori este validă Trebuie pur și simplu să verificăm dacă această formulă a p are valoarea T pentru toate valorile posibile (T sau F) ale formulelor atomice conținute în ea Ch Demonstrarea teoremelor în calculul predicatelor Când apar cuantificatori, valabilitatea sau lipsa acestora nu poate fi întotdeauna stabilită S-a dovedit a fi comun nu există nicio metodă pentru a găsi valorile tuturor formulelor infinite care conțin cuantificatori Din acest motiv, calculul predicatului se numește indecidibil Este posibil să se stabilească validitatea doar anumitor tipuri de formule care conțin cuantificatori și, prin urmare, se poate vorbi de subclase decidabile ale calculului predicat Mai mult, dacă o formulă pp este de fapt valabilă, atunci există o procedură de verificare a validității acesteia (Aceeași procedură aplicată formulelor a p care nu sunt în general valabile poate duce la o succesiune nemărginită de operații ) Prin urmare, se poate spune că calculul predicatului este semidecidabil Dacă, sub o interpretare dată, fiecare formulă a p dintr-un set de formule a p are valoarea T, atunci se spune că interpretarea dată satisface această mulțime O formulă bine formată W decurge logic dintr-o mulțime S de formule a p dacă fiecare interpretare care satisface S satisface și W (VxVy) {P (x) VQ (//)} (Vz){P(z)VQ(x) )}}, iar P(a) decurge logic din {(Vx)P(x)} Este mai puțin evident că {(Vx)Q(x)} decurge logic din {(Vx){~P(x) V VQW), (xx)P(x)}, Acest concept de consecință logică îl vom pune la baza conceptului de probă O dovadă că o anumită formulă pp W decurge logic dintr-un anumit set S de formule bine formate este o demonstrație a faptului că W rezultă logic din S faptul că o formulă pp dată decurge logic dintr-un set de formule pp și arată modul în care această metodă poate fi aplicată la rezolvarea problemelor Faptul că calculul predicatului este "indecidibil" înseamnă, de asemenea, că, având în vedere o formulă arbitrară a p W și o mulțime arbitrară S de formule a p , nu există nicio procedură eficientă care să permită întotdeauna să se decidă dacă W decurge logic din S Dacă W într-adevăr rezultă din S , apoi există proceduri care în cele din urmă ne spun acest fapt Totuși, dacă W nu decurge din S, atunci aceleași proceduri, din păcate, nu pot stabili întotdeauna acest lucru Cu toate acestea, a putea demonstra că W decurge logic din S (atunci când o face de fapt) este deja suficient de util încât să ne concentrăm atenția asupra lui Să presupunem că W rezultă logic din S Atunci orice interpretare care satisface S îl satisface și pe W Dar rețineți că promoții că aceste interpretări nu satisfac ~ W Prin urmare, nicio interpretare nu satisface uniunea S și Dacă o mulțime, pp de formule nu este satisfăcută sub nicio interpretare, atunci se numește nesatisfăcător (sau impracticabil) Astfel, dacă W decurge logic din S, atunci uniunea SU {~ IV} este nesatisfăcătoare În schimb, dacă ,SU {~ IV} este nesatisfăcător, atunci W trebuie să decurgă logic din S Folosim acest rezultat pentru a da aceeași formă tuturor problemelor de demonstrație: pentru a demonstra consecința logică a lui W din S, vom arăta că uniunea SU {~ } este nesatisfăcătoare Pentru a arăta că un anumit set de formule a p este nesatisfăcător, este necesar să se demonstreze că nu există o astfel de interpretare sub care fiecare dintre formulele a p din acest set să aibă valoarea T Deși această sarcină pare laborioasă, există destul de eficiente procesează deciziile ei Pentru a efectua aceste procedee, este nevoie mai întâi de a prezenta formulele ap ale unei mulţimi date într-o formă convenabilă specială - sub formă de propoziţii ) PROMOȚII Orice formulă a p a calculului predicatului poate fi reprezentată ca o propoziție prin aplicarea unei secvențe de operații simple Sarcina noastră imediată este să arătăm cum să dăm unei formule arbitrare a p forma unei propoziții Vom ilustra acest proces folosind formula a p (Vx) {P (x) = ${(Vy) {P (y) ⩽ P(f (x, z/))} }} Procesul constă din următorii pași: ) Eliminarea semnelor de implicare În forma propoziției, numai conectivele V și ~ sunt utilizate în mod explicit în calculul predicatului Semnul implicației poate fi eliminat prin înlocuirea în enunțul original ДV В" în loc de "Д=>В" * ) Această înlocuire din exemplul nostru dă (Vx){~P(x) V {(Ay){~P(y) VP(f(x, y))} D A ~(Vy) {~Q(x, y) VP (r/)}}} ') În clauza originală, care uneori este tradusă în această situație prin "disjunct" - Notă, trad ) Cititorul trebuie să se asigure că aceste substituții păstrează valoarea de adevăr a originalului a p formule Mai formal, ar trebui să arătăm că "~A V " decurge logic din "A =^> B" și "A =$> B" rezultă logic din "~L V B", și să facem exact același lucru pentru toate celelalte substituții care vom face Cap Demonstrarea teoremelor în calculul predicatelor ) Reducerea sferei semnelor negative Dorim ca negația ~ să se aplice la cel mult o literă de predicat Aplicând în mod repetat următoarele substituții, puteți reduce domeniul de aplicare al fiecărui ~ la o singură literă de predicat: înlocuiți ~(AD£) cu ~Ay ~B, înlocuiți ~(L V B) cu ~AD~B, înlocuiți ~~L cu A, înlocuiți ~(Vx)L cu (Ex){~L), înlocuiți ~( x) A pe (Vx){~L) Apoi formula noastră a p va lua mai întâi forma A ( z/){~{~Q(x, y) V (*/)}}}} și apoi (Vx) {~ P (x) V {(Vz/) {-P (y) Y P(f (x, y))} /\ A ( z/){Q(x, y} K~P(z/)}}} ) Standardizarea variabilelor În domeniul oricărui cuantificator, variabila pe care o leagă este o variabilă stupidă Prin urmare, peste tot în domeniul de aplicare al cuantificatorului, acesta poate fi înlocuit cu o altă variabilă, iar acest lucru nu va duce la o modificare a valorii de adevăr a formulei ap Standardizarea variabilelor într-o formulă pp înseamnă redenumirea variabilelor stupide, astfel încât fiecare cuantificator să aibă propria sa variabilă stupidă Deci, în loc de (Vx) {P (x) => ( x) Q (x)} ar trebui să scrieți (Vx) {P (x) => ( z/) Q (#)} Standardizarea din exemplul nostru dă A (Za") {Q (x, w) L ~ P (a")}}} ) Excluderea cuantificatorilor existențiali Luați în considerare o formulă bine formată (Vz/ x)P(x, y), care poate fi interpretat, de exemplu, după cum urmează: "Pentru tot y, există un x (posibil dependent de y) astfel încât x este mai mare decât y" Rețineți că, deoarece cuantificatorul de existență O*) se află în domeniul de aplicare al cuantificatorului universal (V y), este posibil ca un x care "există" să depindă de valoarea lui y Fie ca această dependență să fie definită explicit cu ajutorul unei funcții g(y) care mapează fiecare valoare a lui y în acel "există" O astfel de funcție se numește funcția Skolem Dacă în loc de x, care "există", luăm funcția Skolem, atunci putem elimina cuantificatorul de existență: (Vz/)P(^(z/),z/) promoții Regula generală de excludere dintr-o formulă de cuantificator de apexistență este de a înlocui peste tot în ea variabila care se referă la cuantificatorul existențial cu o funcție Skolem ale cărei argumente sunt variabile care se referă la acei cuantificatori universali ale căror sfere acoperă domeniul de aplicare al cuantificatorului existențial exclus Literele funcționale pentru funcțiile Skolem trebuie să fie "noi" în sensul că nu trebuie să coincidă cu acele litere care există deja în formula a p Astfel, excluzând ( z) din formula a p {(Vw) Q(w)}=>(Vx){(Vz/){( z){P(x, y, z)=$>(Vu) R(x, y, u, z)}} }, primim {(Vw)QM}=^>(Vx){(Vy){/>(x, y, g(x, "/))=>(V") R(x, y, u, g(x, y))))) Dacă cuantificatorul existențial care trebuie exclus nu aparține domeniului niciunuia dintre cuantificatorii universali, atunci funcția Skolem nu are argumente, adică este pur și simplu o constantă Astfel, ( x)P(x) devine P(a), unde a este o constantă despre care știm că "există" Pentru a elimina toate variabilele legate de cuantificatorii existențiali, aplicați procedura de mai sus fiecărei variabile pe rând În exemplul nostru, eliminarea cuantificatorilor existențiali (aici există doar un astfel de cuantificator) oferă A {Q(x, g(x)) A ~ P(g(x))}}}, unde g(x) este funcția Skolem ) Reducerea la forma normală preliminară În această etapă, nu au mai rămas cuantificatori existențiali, iar fiecare cuantificator universal are propria sa variabilă Acum putem transfera toți cuantificatorii universali la începutul formulei ap și să considerăm întreaga parte a formulei ap situată după aceasta ca sfera fiecărui cuantificator Se spune că formula a p rezultată are o formă normală prenex O formulă bine formată în formă normală preex constă dintr-un lanț de cuantificatori, numit prefix, urmat de o formulă fără cuantificatori, numită matrice Forma normală prenex pentru nanzele unei formule a p este (Vx V y) {~P (x) V {{-P (Y) V P (f(x, y))} A A {Q(x, g(x)) A~P(g(x))}}} ) Reducerea matricei la forma normală conjunctivă Orice matrice poate fi reprezentată ca o conjuncție a unui set finit de disjuncții de predicate și (sau) negații ale acestora Ch Demonstrarea teoremelor în calculul predicatelor Se spune că o astfel de matrice are o formă normală conjunctivă Dăm exemple de matrice în formă normală conjunctivă: {P (x) VQ (x, y)} A {P (da) V ~ R ("/)} A Q (x, y), P(x)V Q(x, y), P(x) l Q(x, y), Orice matrice poate fi redusă la forma normală conjunctivă prin aplicarea regulii de mai multe ori: Înlocuiți A V {B L C) cu {L V B} L M V C} După reducerea matricei formulei noastre ap la forma normală conjunctivă, aceasta ia forma (VxVy) {{~P (x) V ~P (?) V P (f (x, y))} /\ A {~P " VQ(X, g(x))} A {~P(x) * ~P(g(x))}} ) Eliminarea cuantificatorilor universali Deoarece toate variabilele p p formulele trebuie legate, atunci toate variabilele rămase în această etapă sunt cuantificatori universali Deoarece ordinea cuantificatorilor universali nu este semnificativă, acești cuantificatori pot fi omise explicit, cu condiția ca toate variabilele din matrice să fie cuantificatori universali Acum rămânem cu o matrice în formă normală conjunctivă ) Excluderea ligamentelor "și" Acum putem elimina semnul "și" L, înlocuind A L B cu două p p formulele A, B Rezultatul înlocuirii multiple va fi un set finit de formule a p , fiecare dintre acestea fiind o disjuncție a formulelor atomice și (sau) negațiilor acestora O formulă atomică sau negația ei se numește literal, iar o formulă bine formată constând numai din disjuncții de literale se numește propoziție e) Deci, fiecare formulă a p din setul nostru va fi o propoziție Formula noastră a p este acum prezentată ca următoarele propoziții: ~P(x)V~P(y)VP(f(x,y)), ~P(x)VQ(x, g(x)), ~P(x)V~P(g(x)) Rețineți că literalele de propoziție pot conține variabile, care ar trebui să fie întotdeauna considerate a fi cuantificatori universali Dacă în loc de variabile literale *) Vezi nota de la pagina - Aprox, trad Universul Herbran sunt înlocuite expresiile care nu conțin variabile, apoi obținem așa-numitul caz special constant al acestui literal Astfel, Q(a,,f(g(b))) este un caz special constant al a p formulele Q(x, y) Procesul nostru de a demonstra că un set S de formule a p este nesatisfăcător (imposibil) începe prin a transforma fiecare formulă a p din S în propoziții Ca urmare, apare un anumit set S de propoziții Se poate arăta că dacă S este nesatisfăcător, atunci S' este de asemenea nesatisfăcător și invers, S' fiind nesatisfăcător implică că S este nesatisfăcător În restul acestui capitol, vom prezenta metode pentru a arăta că un anumit set de propoziții nesatisfăcut este într-adevăr nesatisfăcător Aceste metode sunt destul de generale, deoarece orice set de formule bine formate poate fi reprezentat ca propoziții HERBRAN UNIVERSUM Să considerăm o mulțime S finită nesatisfăcută de propoziții Pentru a verifica că S este nesatisfăcător, trebuie să se arate că nu există nicio interpretare care să-l satisfacă Atunci când dăm o interpretare lui S, trebuie mai întâi să definim domeniul D, iar apoi să asociem fiecărui simbol constant din S un element din D și cu fiecare simbol al funcției din S o funcție pe D și așa mai departe Este evident că pentru pentru a demonstra că fiecare rezultat ca urmare, interpretarea nu satisface S, nu suntem în măsură să enumerăm toate zonele posibile și astfel de conexiuni Dar este posibil să se furnizeze o listă atât de adecvată de nume pentru elementele unui domeniu încât, dacă nu există o interpretare satisfăcătoare în domeniile ale căror elemente pot fi denumite după nume din lista noastră, atunci nu există nicio interpretare satisfăcătoare O astfel de listă de nume, adecvată setului de propoziții S, este universul Herbrand pentru S Universul Herbrand H(S) pentru un set de propoziții S este definit recursiv după cum urmează: Mulțimea tuturor literelor constante țf°) menționate în S aparține lui H(S) Dacă {/ } este gol, atunci H(S) conține o literă constantă arbitrară, de exemplu a Dacă termenii , tn aparțin lui H(S), atunci H(S) aparține și lui n/ , unde /" este orice literă funcție menționată în S Nu există alți termeni în H(S) cap Demonstrarea teoremelor în calculul predicatelor Ar trebui să fie clar că, indiferent de alegerea interpretării, atunci când se atribuie valorile T și F literalilor din S, nu vor fi niciodată necesare alte nume pentru elementele domeniului de aplicare În acest sens, H(S) este domeniul cel mai general; dacă arătăm că mulțimea S este nesatisfăcătoare în regiunea H(S), atunci putem fi siguri că este nesatisfăcătoare în orice regiune Universul lui Herbrand, în general vorbind, este infinit, dar numărabil, astfel încât membrii săi pot fi întotdeauna ordonați într-un fel sau altul De exemplu, luați în considerare setul de propoziții S: {/>(x) VQ(a) V~P(f(x)), ~Q(b)VP(g(x, y))} Aici termenii constanți sunt {a, b}, iar funcțiile sunt {f, g} Astfel, H(S) este o mulțime infinită (numărabilă) {a, b, f (a), f(b), g (a, a), g (a, b), g (b, a), g (b, b), BAZĂ ERBRAN Când dăm o interpretare (pe H(S)) unei propoziții în S, formulelor sale atomice li se atribuie valorile (G sau F) Să presupunem că P este o literă de predicat de n locuri în S Formula atomică P(xi, x , , xn) este evaluată prin atribuirea de valori lui T și F independent pentru toate cazurile sale speciale constante rezultate din substituție de elemente din H( S) în locul variabilelor x x , , xn Desigur, numărul de cazuri speciale constante pentru fiecare formulă atomică din S se poate dovedi a fi infinit de mare, astfel încât în acest fel este posibil să se rezolve problema valorii la infinit Dar este remarcabil că, înainte ca evaluarea fiecărei formule atomice din S să fie finalizată, va deveni destul de evident că nicio interpretare nu poate satisface S, iar acest lucru se va întâmpla în ciuda faptului că nici măcar tuturor cazurilor speciale constante nu li s-au atribuit valori de adevăr! Baza Herbrand pentru S este setul tuturor cazurilor speciale constante pentru toate formulele atomice din S, cu condiția ca universul Herbrand să fie folosit pentru a denumi elementele domeniului Elementele bazei Herbran se numesc atomi Evident, sarcina de interpretare pe H(S) se încheie pentru toate propozițiile din S numai atunci când fiecărui atom al bazei Herbran i se atribuie o valoare de adevăr Baza Herbran este, de asemenea, numărabilă și, prin urmare, elementele sale pot fi ordonate într-un fel sau altul Fie ca baza ordonată Herbran pentru S să fie scrisă ca șirul {pi, pr, p , } Construirea unui arbore semantic CONSTRUIREA UNUI ARBOR SEMANTIC Arborele semantic este un arbore binar ) extinzându-se în jos de la vârful rădăcinii Conform modului în care am ales să atribuim valori de adevăr atomilor pi ai bazei Herbran, vom coborî acest copac pe o anumită cale Dacă atribuim valoarea T atomului p^, atunci ne vom afla direct sub vârful rădăcinii din stânga, iar dacă F, atunci în dreapta În plus, indiferent care dintre cele două vârfuri situate imediat sub vârful rădăcinii, am ajuns, dacă atribuim valoarea T atomului pr, atunci mergem de la acesta de-a lungul ramurii stângi, iar dacă F, atunci de-a lungul dreptei Acest proces continuă până când fiecărui element al bazei Herbran i se atribuie o valoare de adevăr Evident, în cazul unei baze Herbran infinite, orice interpretare completă va corespunde unui drum infinit în josul vârfurilor acestui arbore Un arbore complet care conține toate căile posibile reprezintă toate interpretările posibile ale propozițiilor din S; de unde şi numele: arbore semantic Ca exemplu, luați în considerare setul nesatisfăcut S de propoziții P(x)VQ(y), ~P(a), Universul lui Herbrand aici este un set finit H(Ș) = {a, b} Baza lui Erbran este, de asemenea, finită Poate fi ordonat astfel: {P(a), Q(a), P(b), Q(b)} Arborele semantic pentru acest set de propoziții este finit, este prezentat în Fig Fiecare muchie care conectează un vârf de unul dintre vârfurile sale copil reprezintă o decizie luată cu privire la valoarea de adevăr a unuia dintre atomii din baza Herbran Am convenit să scriem lângă marginea în care valoarea T este atribuită atomului, acest atom însuși, iar lângă marginea în care valoarea F este atribuită atomului, negația acestuia Fiecare dintre căile care duc de la nodul rădăcină la nodul final al acestui arbore (și anume, la nodul situat în partea de jos a acestui arbore) oferă una dintre interpretările pentru mulțimea S Această interpretare poate fi reprezentată în mod unic în - g *) Fiecare vârf al unui arbore binar are exact două vârfuri copil, dacă există Este posibil să se generalizeze definiția unui arbore semantic astfel încât să fie permise mai mult de două astfel de noduri Ch Demonstrarea teoremelor în calculul predicatelor sub forma unei multitudini de atomi întâlniţi pe parcurs Astfel, interpretarea obținută prin trasarea căii de la vârful rădăcinii până la vârful final marcat în Fig prin numărul , este dat de mulțime I = {/>(а), ~Q(a), ~P(b), Q( )} Vârfuri nefavorabile Un astfel de set se numește model pentru un anumit set de propoziții Se spune că un model nu satisface o propoziție dacă există un caz special constant al acestei propoziții (construit pe termenii universului Herbrand) care are valoarea F sub valorile determinate de acest model Deci, nu satisface niciuna dintre propozițiile ~P(a) și, în mod similar, M = ~Q(a), ~P(b), ~Q(b)} nu satisface este egal cu propoziția P(x)VQ(y) deoarece cazul special constant P(a)VQ(b) are valoarea F Dacă există o propoziție în S care nu este satisfăcută de o interpretare sau model, atunci acest model nu poate satisface S Astfel, Mi și M nu satisfac mulțimea S din exemplul nostru, în plus, putem exclude fiecare dintre cele interpretări posibile la rândul său și trageți concluzia că mulțimea S din exemplul nostru este nesatisfăcător TOPURI DEFAVORABILE Cel mai important fapt despre arborii semantici este capacitatea de a determina, fără a privi la infinit în josul arborelui, că anumite interpretări nu satisfac un anumit set de propoziții În exemplul nostru din fig În Figura , am atribuit valoarea T atomului P(a) chiar sub nodul rădăcină din stânga Este imediat clar că niciuna dintre cele opt interpretări posibile în care P(a) are valoarea T nu satisface S; pentru a satisface S, valoarea atomului P(a) trebuie să fie F Deci, nu este nevoie să privim mai departe în partea stângă a acestui arbore Să marchem cu cercuri negre acele vârfuri ale arborelui din fig , unde s-a stabilit mai întâi că această interpretare nu poate satisface S Asemenea vârfuri vor fi numite nefavorabile Desigur, dacă setul de propoziții este nesatisfăcător, atunci chiar și atunci când baza Herbran este infinită, fiecare interpretare posibilă trebuie să se termine în cele din urmă la un vârf nefavorabil Într-adevăr, dacă cel puțin o interpretare nu s-ar spăla la un vârf nefavorabil, atunci am putea merge pe această cale pentru o perioadă de timp arbitrar, adică ar exista o interpretare care să satisfacă un set de propoziții, ceea ce contrazice nesatisfăcătorul acestui set Un arbore semantic pentru un set de propoziții S, ale căror căi se termină la vârfuri nefavorabile, se numește închis pentru S Astfel, am obținut rezultatul cheie pe care se bazează metodele noastre de verificare a îndeplinirii proprietății nesatisfăcătoare Arborele semantic pentru un set nesatisfăcut de propoziții S Ch Demonstrarea teoremelor în calculul predicatelor Orez Arborele semantic închis pentru un set imposibil {~P(x) VQW, este închisă pentru S și conține un număr finit de vârfuri situate deasupra vârfurilor nefavorabile ) ') Se poate arăta că această afirmație este echivalentă cu celebra teo- reme Erbraia ( ) Vârfurile de ieșire *' Pe fig arată o parte din arborele semantic pentru un set nesatisfăcut de propoziții S = {-P (x) VQ (x), P (f (y)), ~Q (f (y))} Universul lui Herbrand aici va fi platoul H (S) ~ {a, f (a), f (f (a)), f (f (f (a))), iar baza Herbran poate fi comandată astfel: {P(a), Q(a), P(f(a)), Q(f(a)), P(f(f(a))), } Deși baza Herbran este infinită, astfel încât orice interpretare completă corespunde unui drum infinit prin acest arbore semantic, știm că, în cazul în care S este nesatisfăcător, arborele semantic este închis de vârfuri nefavorabile Pe fig prezintă partea arborelui semantic situat deasupra nodurilor nefavorabile și incluzându-le În practică, rareori se poate stabili imposibilitatea unui set de propoziții prin construirea unui arbore semantic Recent, pe baza principiului rezoluțiilor, au fost elaborate proceduri practic acceptabile de stabilire a nesatisfăcătoriei În secțiunile următoare, vom explica esența acestui principiu, folosind reprezentările deja descrise asociate arborilor semantici VERTICELE DE IEȘIRE Luați în considerare din nou exemplul prezentat în fig Fiecare dintre vârfurile nefavorabile ale acestui arbore are proprietatea că orice completare a părții de interpretare dată până la acel vârf nu satisface una dintre propozițiile mulțimii noastre Sub vârful nefavorabil, marcat în Fig cu numărul , există interpretări care evident nu satisfac propoziţia ~Р(х) VQ(x) Sub vârful nefavorabil, marcat cu cifra , există interpretări care evident nu satisfac propunerea (I #)) Vom numi nodul defavorabil pentru ~P(x)VQ(x) și nodul defavorabil pentru ~Q(f(y)) - Vom spune, de asemenea, că propozițiile ~P(x)VQ(x) și eșuează la vârfurile și, respectiv, Dacă un nod al arborelui semantic nu este nefavorabil, iar ambele noduri secundare sunt nefavorabile, atunci se numește nod de ieșire Pe fig , vârful marcat este un vârf de inferență, deoarece este posibil să se derivă o nouă propoziție care decurge logic din propozițiile ~P(x) VQ(x) și (/(#))> care eșuează imediat la vârfurile nefavorabile urmând-o De asemenea, această nouă propoziție eșuează în partea de sus a rezultatului sau Ch Demonstrarea teoremelor în calculul predicatelor deasupra ei (Desigur, această nouă propoziție nu există în S, deoarece altfel nodul , sau un nod care îl precede, ar fi nefavorabil ) Ce presupunere poate fi dedusă din propozițiile ~/)(z)VQ(x) și ~Q(f (*/))? Fie / o interpretare arbitrară care satisface ambele propoziții ~P(x)VQ(x)h ~Q(f(y)) Întrucât interpretarea lui I satisface ~P(x)VQ(x), ea trebuie să satisfacă și orice propoziție rezultată din ea prin substituirea unei alte expresii cu x În special, trebuie să satisfac propoziția VQ(f(y))- Dar literalul Q(f(y)) nu poate poate fi satisfăcută de această interpretare, întrucât am presupus că interpretarea lui / satisface negația lui ~Q (/(*/)) Prin urmare, dacă interpretarea lui / satisface propoziția ~P(f(y)) VQ(f ( y)), atunci numai pentru că eu satisface propoziția ~ P(f(y)) Apoi din aceste două propoziții putem deduce propoziția ~P(f(y)) De asemenea, rețineți că atribuirea valorilor de adevăr literalelor suplimentare Q(f(a)) și ~Q(f(a)) nu modifică valoarea propoziției deduse ~ P(f(y)) - Propoziția dedusă are deja a eșuat în partea de sus a ieșirii (top ) Propoziţia derivată ~P(f(y)) se numeşte rezoluţia celor două propoziţii ~P(x)VQ( v) şi ~Q(f(*/)) Dacă două propoziții au rezoluții (pot fi mai multe), atunci procesul de obținere a acestora depinde de capacitatea de a face astfel de substituții de termeni în loc de variabile, astfel încât propozițiile rezultate din substituții să conțină literale suplimentare Vom discuta puțin despre detaliile acestui proces, dar deocamdată să presupunem că avem un astfel de proces de inferență și are proprietatea că rezolvările eșuează la sau deasupra vârfului inferenței Orice arbore semantic închis pentru o mulțime S nesatisfăcută de propoziții nevide trebuie să aibă cel puțin un vârf de ieșire, deoarece, altfel, fiecare dintre vârfuri ar avea cel puțin un vârf copil care nu este defavorabil, ceea ce contrazice închiderea presupusă a arborelui Să avem un proces de derivare a rezoluției C a două propoziții care eșuează sub un vârf de derivare n astfel încât C eșuează la sau peste n Atunci este posibil să se formeze un nou set (încă) nesatisfăcător de propoziții S' - {C} U S Arborele semantic pentru S trebuie să fie arborele semantic pentru S', dar numai pentru S' nodul n (sau vreun nod) deasupra acestuia) va fi nefavorabil Este clar că numărul de vârfuri deasupra vârfurilor nefavorabile din arborele pentru S' este strict mai mic decât în arborele pentru S Cu toate acestea, arborele pentru S' trebuie să aibă cel puțin un vârf de ieșire, Unificare în aşteptarea unei noi rezoluţii C' Acest proces se repetă, iar la fiecare etapă, numărul de vârfuri situat deasupra vârfurilor nefavorabile din noul arbore semantic (încă închis) va fi mai mic După un număr finit de inferențe, arborele nu va avea vârfuri situate deasupra vârfurilor nefavorabile, adică vârful rădăcinii va fi nefavorabil Deoarece atribuirile de adevăr-valoare sunt făcute numai sub rădăcină, această rădăcină eșuează doar pe o propoziție goală (adică, o propoziție care nu conține literale) Procesul de obținere a soluțiilor care eșuează la sau deasupra vârfurilor de derivație poate fi acum utilizat pentru a arăta că o mulțime de propoziții nesatisfăcute S este într-adevăr nesatisfăcător În primul rând, trebuie să obțineți toate rezoluțiile posibile ale tuturor perechilor de propoziții din S Deoarece trebuie să existe cel puțin un nod de derivare în arborele semantic pentru S, una dintre rezoluții trebuie să eșueze la sau deasupra acestui nod de derivare Astfel, arborele semantic pentru S' = SU {toate rezoluțiile tuturor perechilor din S} este încă închis și are mai puține vârfuri deasupra vârfurilor nefavorabile Continuarea unui astfel de proces prin găsirea tuturor soluțiilor tuturor perechilor de propoziții din S și așa mai departe, trebuie să conducă în cele din urmă la o propoziție goală Mai mult, dacă arătăm că rezoluția unei perechi de propoziții decurge logic din această pereche, atunci se va dovedi că apariția unei propoziții goale ca urmare a acestui proces înseamnă că mulțimea inițială S este nesatisfăcătoare (Propoziția goală este trivial nesatisfăcătoare; baza ei Herbran este goală, deci nu există niciun model care să o satisfacă ) UNIFICARE Trebuie să discutăm acum despre procesul numit unificare, care este fundamental pentru transformările formale efectuate la găsirea rezoluțiilor Termenii literali pot fi litere variabile, litere constante și expresii constând din litere funcționale și termeni Un caz special (de substituție) al unui literal este obținut prin înlocuirea unor termeni cu variabile în literale De exemplu, pentru literalul P(x,f(y),b) sunt cazuri speciale P (z, f (ay), b), P (x, f (a), b), P (g (z), f (a), b), P (c, f (a), b) A M Ch Demonstrarea teoremelor în calculul predicatelor Primul caz special se numește versiunea alfabetică a literalului original, deoarece aici doar alte variabile sunt înlocuite pentru variabilele din P(x, f(y), b) Ultimul dintre cele patru cazuri speciale enumerate se numește caz special constant, sau atom, deoarece niciunul dintre termenii acestui literal nu conține variabile În cazul general, orice permutare poate fi reprezentată ca un set de perechi ordonate care peste tot variabila vi este înlocuită cu un termen Este esențial ca variabila în fiecare dintre aparițiile sale să fie înlocuită cu același termen, adică rezultă din ij că o, =^= Vj, i, j = , , n Pentru a obține cazuri particulare ale literalului P(x,f(y),b), s-au folosit patru substituții a = {(z, x), (w, y)}, P = {(a, Y)}, Y = {(£(z)> x), (a, y)}, b = {(c, x), (a, y)} Notăm cu P$ cazul particular al literalului P obținut prin utilizarea substituției Ѳ De exemplu, P(rD(w), b) = P(x, f (y), b) inclus în numărul de variabile din a De exemplu, {g(x, y), z)}{(a, x), (b, y), (c, ay), (d, z)} = = {(£ (a, b), z), (a, x), (b, y), (c, ay) } Se poate demonstra că aplicarea succesivă a substituțiilor aer la literalul P- dă același rezultat ca și aplicarea substituției ap la P, adică (Pa)p = Pa₽ De asemenea, se poate demonstra că compoziția permutărilor este asociativă: ( Q(a), atunci este clar că în acest caz rezoluția coincide cu modus ponens ') Modus ponens este numele latin pentru prima formă a unui silogism ipotetic exprimat prin formula ( V ( ->B))->-B (adică dacă B urmează din A și are loc A, atunci B are și el loc) - Aprox ed cap Demonstrarea teoremelor în calculul predicatelor Considerăm acum rezoluția ~P(x)VQ(x) a două propoziții V /?(x) și ~/?(x) VQ(x) În mai familiar notație (și, de asemenea, în rusă), acest lanț de raționament arată astfel: Logica obișnuită în rusă (yx) {P(x) => X(x)} Orice lucru care are proprietatea P are proprietatea X (Vx) {I (x) => Q (x)} Tot ceea ce are proprietatea R> are proprietatea Q Prin urmare: (yx) {P(x) => Q(x)} Tot ceea ce are proprietatea P are proprietatea Q Această concluzie este unul dintre silogisme PRINCIPIUL REZOLUȚIEI') Să rezumăm pe scurt ideile principale ale acestui capitol Vrem să putem găsi o dovadă că o formulă W bine formată în calculul predicatului decurge logic dintr-o mulțime S de formule bine formate Am arătat că aceste sarcini? este echivalentă cu problema de a demonstra că setul {~U }US este nesatisfăcător Procesele de identificare a nesatisfăcătoarei unui anumit set de propuneri se numesc procese de respingere - Pentru a aplica un caz particular al procesului de infirmare aplicabil formulelor a p sub formă de propoziții, am dat o succesiune simplă de operații care ne permite să reprezentăm orice formulă a p sub formă de propoziții Apoi au introdus conceptul de regiune numită universul Herbrand pentru un set S de propoziții și au explicat cum să folosești arborele semantic construit pe baza lui pentru a reprezenta toate interpretările propozițiilor din S Dacă mulțimea S este nesatisfăcătoare, atunci, desigur , nu se poate găsi o interpretare sub care toate n formulele din S să fie adevărate O astfel de nesatisfăcătoare a mulțimii S este indicată de închiderea arborelui său semantic Am arătat cum o regulă generală de inferență numită rezoluție poate fi folosită pentru a crea propoziții noi În continuare, vom arăta că atunci când aceste propoziții sunt adăugate la S, arborele semantic ') Vezi nota de la p - Notă, trad Principiul rezoluției pentru noul set (încă nesatisfăcut) vor fi mai puține vârfuri peste vârfurile nefavorabile, iar acest proces poate fi continuat până când rămâne doar vârful rădăcină, corespunzător vârfului nefavorabil pentru propoziția goală Conchidem că dacă vom continua să implementăm rezoluții pe setul de sentințe nesatisfăcute, atunci în Orez Graficul de infirmare pentru mulțimea nesatisfăcătoare {P(x)VQW, ~Q(f(z)), (f(z)) V/?(*) ~/?((r))} ajungem cu o propoziție goală Acest rezultat ne permite să folosim doar regula rezoluției în procesul de respingere fără referire explicită la arborii semantici Fie S?(S) unirea unei mulțimi S cu mulțimea tuturor rezolutorilor tuturor perechilor de propoziții ale sale Fie ? (S) să desemneze ?( ?(S)) și așa mai departe S) va fi o propoziție goală Deoarece mulțimea $!'($) este finită pentru orice i dacă S este finită, atunci această strategie simplă pentru găsirea unei infirmații este un proces finit (deși poate lung) Formarea multimilor ?(S), ? (S), corespunde unei enumerari complete in cautarea unei infirmari În cap În capitolul vom discuta diferite strategii de căutare care sunt mai eficiente decât această strategie simplă Refutările folosind rezoluții (uneori numite dovezi prin rezoluții) pot fi Ch Demonstrarea teoremelor în calculul predicatelor ilustrați cu structuri de tip grafic, în care la fiecare vârf este scrisă o anumită propoziție Propozițiile din S sunt scrise la vârfurile de sfârșit ale acestui grafic Dacă două propoziții situate la vârfurile de capăt sunt rezolvate, atunci rezoluția lor este scrisă în vârful imediat care le urmează, care este conectat la aceste puncte de capăt Orez Graficul de refuzare pentru un set nesatisfăcător OSH- vârfuri cu ajutorul muchiilor Rădăcina graficului de respingere prin rezoluție (aceste grafice sunt de obicei desenate cu rădăcina situată în partea de jos a figurii) este o propoziție goală (notată prin simbolul zero) Pe fig prezintă un exemplu de grafic de infirmare pentru un set de propoziții nesatisfăcute Aici sunt necesare rezoluții pentru respingere Un alt exemplu este prezentat în fig (Rețineți că în Figura propoziția C(x) este folosită de două ori în grafic Uneori, aceste grafice sunt reprezentate ca arbori, repetând subarborii care apar de mai multe ori ) Consecvența și completitudinea rezoluției CONSISTENȚA ȘI COMPLETITUDINEA REZOLUȚIEI În această secțiune, vom arăta că principiul rezoluției este consecvent și complet Consecvența înseamnă că, dacă ajungem vreodată la o propoziție goală, atunci setul original trebuie să fie nesatisfăcător Completitudine înseamnă că, dacă setul original este nesatisfăcător, atunci vom ajunge la o propoziție goală Pentru a arăta consistența principiului rezoluției, este necesar să se demonstreze că rezoluția a două propoziții decurge logic din aceste propoziții, adică, în notația anterioară, că ]x decurge logic din (Li} și {L ,}) Rețineți că fiecare interpretare care satisface {LJ și {Lc) satisface și {L ,}x Dar, deoarece nicio interpretare nu poate satisface atât {іі}i cât și {/"іk, atunci fiecare interpretare care satisface {LJ și {LM, de asemenea satisface rezolutia acestora Astfel rezolutia decurge logic din propozitiile pe care este construita Pentru a arăta că principiul rezoluției este complet, este suficient să arătăm că este complet în raport cu vârfurile de derivare din arbori semantici Notăm cu Tr arborele semantic închis pentru un set nesatisfăcător de propoziții S și fie n un vârf de derivație în Tr astfel încât pi și n sunt vârfuri nefavorabile imediat sub n, dar nicio propoziție din S nu eșuează nici pe n, nici deasupra n Să presupunem acea propoziție {A,} din S eșuează pe u și propoziția {B,} din S eșuează pe n Atunci, în acest caz, completitudinea principiului rezoluției înseamnă existența unei rezoluții pentru {A,} și {B,}, să spunem {CJ, eșuând la sau peste n Este ușor de observat că o astfel de rezoluție există Într-adevăr, fie L un element al bazei Herbran a cărui valoare de adevăr este atribuită chiar sub vârful n Fie, pentru definiție, valoarea lui L adevărată pentru Pi și falsă pentru n Deși nici {AJ și nici {B,} nu eșuează la n, {A,} eșuează la nb și {B,} eșuează la n Luați în considerare mai întâi propoziția {A,} Deoarece eșuează pe nlt, trebuie să conțină cel puțin o submulțime unificabilă, să spunem {a,}, pentru care ~L va fi un caz special constant "general" Fie o un unificator astfel încât {aJd = ~L Mai mult, propoziția {AJ - {a{} eșuează la (sau mai sus) vârful n, deoarece trecerea de la n la " am determinat doar valoarea de adevăr pentru L, în timp ce {A,} eșuează la n\ La fel, deoarece propoziția {B,} eșuează la • , trebuie să conțină o submulțime unificabilă, • Ch Demonstrarea teoremelor în calculul predicatelor spune {bі}, pentru care L va fi un caz special constant "general" Fie m un unificator astfel încât {b,}m = L Propoziția {Bi} - {bj trebuie să eșueze și la (sau mai sus) vârful n Acum unificatorii a și m pot fi combinați, deoarece variabilele din {XJ și {b,} pot fi considerate diferite Să notăm acest unificator combinat prin și Astfel, deoarece {aj(r) = £ și {bz}(r) - ~L, atunci {A,} și {B,} au o rezoluție [ИJ - № U [{В"} - {Ш, unde X este cel mai general unificator pentru {a,} U {-b,} Deoarece X este cel mai general unificator, [{BJ - {a,}](r) este un caz special al propoziției [{A,} - (aA]x, iar [{BJ - {b }](r) este un caz special a propoziției [{ B,} - {bі}]x Atunci, deoarece ambele propoziții [{Li} - {dі}](r) și [{B,} - {bі}](r) eșuează în vârful derivației n (sau mai sus), atunci trebuie să eșueze și propozițiile [{Li} - {dі}]x și [{BJ - {bі}]x Evident, unirea lor - rezoluția noastră - eșuează și ea Pentru a ilustra legătura dintre arborii semantici și construcțiile rezolutive, să ne întoarcem din nou la setul de propoziții S, al cărui arbore semantic este prezentat în Fig Am arătat deja că propoziţia ~/'(x)AQ(jt) eşuează la nodul , propoziţia (/("/)) eşuează la nodul , iar soluţia lor ~P(f(y)) eşuează la nodul - partea de sus a ieșirii În plus, pe arborele semantic pentru mulțimea S' = {~P(f (y))} US, vârfurile nefavorabile sunt vârfurile și La vârful , propoziția P(f(y)) eșuează Construcția soluției pentru P(f(y)) și ~P(f(y)) duce, desigur, la o propoziție goală (eșec la nodul rădăcină) Astfel, dovada imposibilității se încheie după doar două rezoluții NOTE BIBLIOGRAFICE SI ISTORICE Bazele logicii Studiul nostru foarte superficial al logicii matematice poate fi aprofundat prin referire la unele manuale standard Manuale geniale sunt cărțile lui Mendelssohn ( ) și Robbin ( ), iar pentru specialiști, cartea clasică a lui Church ( ) Aceste cărți expun ceea ce s-ar putea numi logica clasică Principiul rezoluțiilor (sau într-adevăr orice discuție despre demonstrarea automată a teoremei) nu și-a făcut încă loc în manualele de logică *) În limba rusă, putem recomanda monografia lui P S Novikov "Elemente de logică matematică", M , - Notă ed Note bibliografice și istorice Acest capitol se bazează pe calculul predicat de ordinul întâi cu rezoluții, deoarece, evident, joacă un rol important în rezolvarea automată a problemelor O omisiune semnificativă aici este însă că nu am luat în considerare relațiile de egalitate Încă nu este clar cum să "construiți" relația de egalitate (și alte relații standard care apar frecvent) în demonstratori automati de teoreme O discuție despre aceste complicații depășește scopul acestei cărți O schemă de încorporare a relației de egalitate în demonstratorii de teoreme este discutată de Robinson și Vos ( ) Mai departe, devine din ce în ce mai clar că pentru a crea dispozitive de decizie universale complexe, este necesar să se implice logici de ordin superior O discuție despre aplicarea logicii de ordin superior la rezolvarea problemelor poate fi găsită în McCarthy și Hayes ( ) Cartea lui Robbin ( ) are o secțiune despre logica de ordinul doi, iar lucrările lui J Robinson ( a, ) tratează problemele generale ale procedurilor de demonstrare pentru logica de ordin superior Pașii pe care i-am identificat în transformarea unei formule bine formate într-un set de propoziții se bazează pe procedura lui Davis și Putnam ( ) O astfel de reprezentare sub formă de propoziții se mai numește și formă normală cojunctiv fără cuantificatori Proceduri și rezoluții de verificare a mărcii Principiul rezoluțiilor în demonstrarea automată a teoremelor se bazează pe procedura de demonstrare a lui Herbrand ( ) O implementare directă a procedurii Herbran ar fi extrem de ineficientă Îmbunătățirile aduse de Pravitz ( ) și alții au condus în cele din urmă la principiul rezoluției, J Robinson ( a) Modul nostru de a prezenta metodele de demonstrare bazate pe rezoluții se bazează pe lucrările lui Kowalski și Hayes ( ) (Vezi și J Robinson, ) Invocarea arborilor semantici face evidentă legătura dintre rezoluții și metodele Herbran și pot fi, de asemenea, utilizați pentru a demonstra aplicabilitatea unor reguli mai generale decât rezoluția simplă Dovada noastră a completitudinii principiului rezoluției este un caz special al dovezii de completitudine a regulii de inferență mai generale dată de Kowalski și Hayes ( ) O expunere clară, concisă a principiului rezoluției, cu o dovadă a completității și consecvenței sale, este dată într-un articol al lui Luckham ( ) Dovada coerenței și completitudinii poate fi găsită în prima lucrare a lui J Robinson ( a) Aceste două lucrări oferă și o dovadă Ch Demonstrarea teoremelor în calculul predicatelor "corectitudinea" algoritmului de unificare J Robinson ( ) a scris și un studiu strălucit despre "demonstrarea teoremei mecanice" Sarcini Dați următoarele p p formule tip de propoziții: a) (xx){P(x)=$ P(x)}, b) {~{(Vx) P (*)}) = $ ( x) {- P (x)}, c) -{(Vx) {P (x)^>{(vy) {P (Y)^P (f (x, y))} A - (Vy) {Q (x, y)=$P ( y)}}}}, d) (VxZy) {{P (x, y) => Q (y, z)} D {Q (y, x) = f S (x, y)}} = f \u d Ф (ЗхВу) {Р (x, y) \u d Ф S (x, y)} În ce condiții universul Erbraia este finit pentru un set de propoziții S? * Scrieți un program pentru a converti formulele p p în formă de propoziții Fie S un set de literali și p o substituție Scrieți un program pentru a calcula Sp Calculul propozițional poate fi văzut ca un caz special al calculului predicatului, unde singurele litere de predicat sunt simbolurile propoziționale p(r) (vezi p ) Cum ar trebui să găsim rezolvarea a două clase în calculul propozițional? Luați negația fiecăreia dintre următoarele formule de calcul propozițional și utilizați principiul rezoluției pentru a demonstra că setul de propoziții care rezultă din fiecare astfel de negație este nesatisfăcător a) (P VQ) ==> (QV P), b) (P=^Q)^> ((A V P) (A VQ)) c) (~P=$P)=$ P, d) (-Q =>~ P) =^> ((-Q => P) => Q), e) ((P = f Q) = f R) = f R * Definiți exact (să zicem, folosind o diagramă) un algoritm de unificare care funcționează în conformitate cu descrierea generală din Sec Utilizați acest algoritm pentru a găsi unificatorul setului {P(x, z, y), P(w, u, w), P(a, u, u)} (Notă: aveți grijă când specificați compoziția exactă a substituțiilor ) Algoritmul dvs detectează corect faptul că mulțimea-{P(x), P()(x))} nu este unificată? Folosind algoritmul, scrieți un program care produce cel mai general unificator al mulțimii S dacă este unificabil și nul în caz contrar Fie C și C două prepoziții Arată cum să folosești programele problematice și pentru a scrie un program pentru a calcula mulțimea tuturor rezoluțiilor propozițiilor C) și C Luați negația fiecăreia dintre următoarele teoreme ale calculului predicatului și folosiți principiul rezoluției pentru a găsi o contradicție: a) (Vx){P(x)^ P(x)}, b) {-{(Vx)P(x)}}^> ( x){-P(x)}, c) {(Vx) {P (x) A Q (x)} {(Vx) P (x)} A {(V#) Q (y)}, d) {( x) (Vy) P (x, y)} {(Vy) ( x) P (x, y)} Capitolul APLICAȚII ALE CALCULULUI PREDICATULUI LA REZOLVAREA PROBLEMELOR CALCUL DE PREDICAT ÎN REZOLVAREA PROBLEMELOR În acest capitol, vom analiza modul în care demonstrațiile teoremelor în calculul predicatelor pot fi aplicate la rezolvarea problemelor Uneori este suficient să știm dacă formula a p W decurge logic dintr-o mulțime S de formule a p Dacă W nu rezultă din S, atunci poate că vrem să știm dacă ~ N decurge din S Desigur, din cauza indecidibilității calculului predicatului, nu este întotdeauna posibil să se determine dacă W (sau ■ - W ) rezultă din S Putem încerca să căutăm răspunsul la fiecare dintre aceste întrebări, iar dacă, după un efort, nu se găsește niciun răspuns sau se epuizează timpul, putem doar concluziona că întrebarea dacă W (sau ~ W ) decurge din S nu se poate răspunde (ținând cont de posibilitățile noastre) Adesea, desigur, se va găsi una dintre dovezi, iar întrebarea va fi decisă În alte aplicații, trebuie să cunoaștem valoarea elementului x (dacă există) pentru care o formulă dată bine formată W (conținând x ca variabilă) urmează logic dintr-o mulțime S de formule a p Cu alte cuvinte, am dori să știm dacă formula (Bx)W(x) urmează logic și, dacă da, care este cazul special al variabilei x "care există" Problema găsirii unei dovezi a unui a p a unei formule ( x)W(x) din S este problema obișnuită a demonstrației în calculul predicatelor, dar pentru a construi un caz special satisfăcător este necesar ca metoda de demonstrare să fie "constructivă" Rețineți că capacitatea de a construi cazuri speciale satisfăcătoare pentru o variabilă legată de cuantificatorul existențial ne permite să ridicăm întrebări de natură foarte generală De exemplu, am putea pune întrebarea: "Există o secvență decisivă pentru un anumit caz de joc la cincisprezece ani?" Dacă cineva poate găsi o dovadă constructivă că există o soluție, atunci se poate indica și soluția în sine Am putea pune o întrebare și mai dificilă: "Există un program care să efectueze anumite calcule?" Din dovada constructivă a existenței sale s-ar putea extrage programul în sine (Evident, trebuie amintit că întrebările complexe conduc în general la dovezi complexe, poate atât de complexe încât cap Aplicații ale calculului predicatului la rezolvarea problemelor procedurile noastre automate de căutare a dovezilor nu le vor găsi ) Scopul principal al acestui capitol este de a descrie procesul prin care un caz particular satisfăcător al unei variabile cuantificatoare existențiale într-o formulă a p poate fi extras din demonstrația unei formule a p care conține acea variabilă Apoi, cu o serie de exemple, vom ilustra aplicarea acestui proces, și a calculului predicat în general, la rezolvarea problemelor Discuția proceselor de căutare în construcția probelor în sine va fi amânată până la capitolul următor Adesea, declarațiile legate de sarcină sunt făcute sub formă de fraze într-o limbă vorbită, cum ar fi engleza Prin urmare, se pune firesc întrebarea în ce cazuri este posibil să se efectueze traducerea automată din limba Aigli în limba formulelor pp pentru calculul predicatului de ordinul întâi Deși un astfel de proces de traducere ar trebui să fie una dintre părțile principale ale unei soluții complete de probleme, nu îl vom lua în considerare aici Au fost scrise mai multe programe care permit traducerea limitată din engleză în limba de calcul al predicatelor, dar capacitatea de a lucra cu limbajul natural este încă într-o stare foarte nesatisfăcătoare Pot fi identificate două dificultăți principale: ( ) alegerea relațiilor care vor fi utilizate la traducerea propozițiilor din engleză și ( ) transformarea fără ambiguitate a sensului încorporat în frază în formule p p folosind simboluri predicate pentru aceste relații Adesea, ambiguitatea poate fi rezolvată doar luând în considerare "contextul" frazei, iar aceasta implică procese dificile și neînțelese pe deplin Problema transformării limbii engleze în formule p p nu este mai ușoară decât, de exemplu, problema conversiei limbii engleze în descrieri de stat, operatori etc se concentrează pe procesele de rezolvare a problemelor deja formulate EXEMPLU Luați în considerare următoarea problemă trivială: "Dacă Michael îl urmărește pe John și John este la școală, unde este Michael?" Este destul de clar că în această problemă se formulează două "fapte", apoi se pune o întrebare, care, aparent, poate fi dedusă din aceste două fapte Aceste fapte sunt ușor de tradus în limbajul formulelor a p și dau următorul set S de formule a p : (Vx) {AT (Ioan, x) => AT (Michael, x)} și AT (Ioan, școală), Exemplu unde simbolului predicat AT i se dă o interpretare evidentă ("a fi într-un anumit loc", corespunzătoare prepoziției "în" - Transl ) La întrebarea "Unde este Michael?" se poate răspunde dacă mai întâi dovedim că formula a p (Eh) AT (Michael, x) rezultă din S și apoi găsiți acel caz special al variabilei x "care există" Ideea cheie aici este de a transforma întrebarea într-o formulă pp care conține cuantificatorul existențial, astfel încât răspunsul la această întrebare să fie o variabilă care se referă la cuantificatorul existențial Dacă pe baza acestor fapte este posibil să se dea un răspuns la întrebare, atunci formula a p astfel construită va urma în mod logic ~ AT (Michael, x) AT (Ioan, x) ѵ AT (Michael, x) Orez Arborele de respingere pentru exemplul luat în considerare din S După găsirea dovezii, încercăm să extragem acea instanță particulară a variabilei cuantificatoare existențiale care servește drept răspuns În exemplul nostru, este ușor să demonstrăm că (Ex) AT (Michael, x) rezultă din S De asemenea, este ușor să arătăm că răspunsul corespunzător poate fi extras folosind o procedură relativ simplă Dovada se obține în mod obișnuit În primul rând, formula a p este infirmată, ceea ce urmează a fi demonstrat Apoi această negație se adaugă la mulțimea S și toți membrii mulțimii extinse sunt transformați în formă de propoziții Mai mult, folosind principiul rezoluției, se arată că acest set de propoziții este nesatisfăcător Arborele de respingere pentru exemplul nostru este prezentat în Fig O formulă bine formată care trebuie demonstrată se numește presupunere, iar propozițiile rezultate din formulele pp conținute în S se numesc axiome Rețineți că negația formulei a p (Ex)AT (Michael, x) dă (Vx)[~AT (Michael, x)], sau, sub formă de propoziție, doar ~AT (Michael, x) C Ch Aplicații ale calculului predicatului la rezolvarea problemelor Acum, din acest arbore de respingere, să extragem răspunsul la întrebarea "Unde este Michael?" Acest lucru se face după cum urmează: ( ) La fiecare propoziție care decurge din negația unei propoziții, se adaugă negația acesteia Atunci ~ AT (Michael, x) ia forma tautologiei ') ~ AT (Michael, x) V AT (Michael, x) ( ) În conformitate cu structura arborelui de infirmare, se execută aceleași rezoluții * ) ca și până acum, până când se primește o propoziție la rădăcină ~AT (Michael, x) ѵ AT (Michael, x) Orez Arborele de dovezi modificat pentru exemplul luat în considerare În exemplul nostru, acest proces generează arborele prezentat în Fig , cu propoziția AT(Michael, școală) la rădăcină ( ) Propoziţia este transformată radical în forma obişnuită de calcul predicat şi folosită ca enunţ reciproc Această formulă a p poate fi apoi tradusă din nou în, să zicem, engleză, ca răspuns la o întrebare Evident, în exemplul nostru, AT (Michael, școală) este răspunsul potrivit la problemă Rețineți că forma declarației de răspuns este apropiată de forma ipotezei În cazul nostru, singura diferență este că în ipoteză avem o variabilă asociată cuantificatorului existențial, în timp ce în enunțul răspuns avem o constantă (răspuns) Înainte de a discuta despre aplicațiile acestei metode, merită să explorați procesul de extracție a răspunsului mai detaliat În secțiunea următoare, vom oferi o justificare pentru ') O tautologie este o formulă ap de forma W ~ W ) Înțelesul cuvintelor "aceleași rezoluții" va fi explicat ulterior Procesul de extragere a răspunsului se discută și se discută cum să o aplice în cazurile în care propoziția "conține atât cuantificatori universali, cât și existențiali PROCES DE PRELUARE RĂSPUNS Recuperarea răspunsului implică transformarea graficului de infirmare (cu nil la rădăcină) într-un grafic a cărui rădăcină conține o aserțiune care poate servi drept răspuns Întrucât, la o astfel de transformare, fiecare propoziție care decurge din negația unei presupuneri se transformă într-o tautologie, graficul transformat este o dovadă că enunțul situat la rădăcina sa decurge logic din axiome și tautologii Prin urmare, rezultă și din axiome și numai din ele Astfel, graficul demonstrativ transformat în sine poate fi folosit pentru a extrage răspunsul Va deveni clar mai târziu de ce o afirmație situată la rădăcina unui arbore de respingere modificat poate fi întotdeauna folosită ca răspuns Deși această metodă este simplă, are câteva puncte subtile, pe care le vom explica cu exemple Exemplul Luați în considerare formule bine formate ) (VxVz/){(P(x, y) /\P(y, z))=>G(x, z)}, ) (Vz/ x){P(x, y)} Ele pot fi interpretate astfel: ) Pentru toate xny, dacă x este părintele lui y și y este părintele lui z, atunci x este părintele lui z ) Fiecare individ are propriul părinte Vom considera aceste formule drept ipoteze și vom pune următoarea întrebare: "Există indivizii x și y astfel încât G(x, "/)?" (Cu alte cuvinte, există x și y astfel încât x este progenitorul lui r/?) Formulăm această întrebare ca o presupunere care necesită dovezi: ( x r/) G(x, y) Această ipoteză este ușor de demonstrat prin metoda infirmării cu ajutorul rezoluțiilor, arătând impracticabilitatea setului de propoziții obținute din axiome și ipoteză Arborele de respingere este prezentat în fig Literalii în curs de unificare în cadrul fiecărei rezoluții sunt subliniați Un subset de literali dintr-o propoziție care suferă unificare în procesul de rezoluție se numește un set de unificare Ch Aplicații ale calculului predicatului la rezolvarea problemelor (negarea ipotezei) ~P(x,y)v ~P(y,z) y G(t,z) (axioma ) ~P(u,y) ѵ ~P(y,o) Orez Arborele de refuzare, de exemplu ~C(u,i>) Rețineți că propoziția P(f(w),w) conține funcția Skolem f, introdusă prin eliminarea cuantificatorului existențial din Axioma : (Vțfâx) {P (x, y)} Această funcție este definită astfel încât (Vy) (P(f(y),y) (Funcția f poate fi interpretată ca o funcție care dă numele părintelui fiecărui individ ) Arborele de probă modificat este prezentat în fig Negația ipotezei se transformă într-o tautologie, iar rezoluțiile sunt aceleași ca în Fig Fiecare rezoluție din arborele modificat se bazează pe seturi de unificare care corespund exact cu seturile de unificare ale graficului de respingere Seturile de unificare din fig sunt subliniate La nodul rădăcină al arborelui de dovezi prezentat în Fig , , se găsește G(f (ț(o)), o) Această propoziție corespunde formulei a p (Vu){G(f(f(o)), o)}, care este o declarație contrară Afirmația reciprocă oferă un răspuns complet la întrebarea: "Există x și y astfel încât x este progenitorul lui y?" Răspunsul în acest caz conține funcția determinantă f: orice v și părintele părintelui acelui v sunt exemple de indivizi care îndeplinesc condițiile întrebării Din nou, afirmația de răspuns are o formă apropiată de cea a unei întrebări Procesul de extragere a răspunsului ~G(u,u) VG(u,v) ~Р(х у) V ~Р(у,г) ѵ g(r,z) ~P(u,y) ѵ ~P(y,U) ѵ G(u,v} ~P(u,rțu)) v G(u,v) Orez Arborele de dovezi modificat, de exemplu Exemplul Vom arăta cum să transformăm în tautologii propoziții mai complexe care apar atunci când presupunerea este negata Luați în considerare următorul set de propoziții: ~D(x) VG(x) VG(f(x)), ~ F (x) V B (x), ~F (x) V C (x), ~ G (x) V B (x), ~G(x)VD(x), A(g(x)) VF(h(x)) Vrem să demonstrăm, pe baza acestor axiome, ipoteza ( x g) {{B (x) L C (x)} V {B (Y) L B (y)}} Negarea acesteia are ca rezultat două propoziții, fiecare conținând două literale: ~ B (x) V ~ C (x), ~ B (x) V ~ B (x) Graficul de respingere pentru setul nostru augmentat de propoziții este prezentat în Fig Acum, pentru a transforma graficul, trebuie să transformăm propozițiile care decurg din negația ipotezei enunțate (în Figura sunt închise într-un cadru) în tautologii adăugând negațiile lor În acest caz, negativele Ch Aplicații ale calculului predicatului la rezolvarea problemelor conţin semnul A Propoziţia ~ B(x) \/ ~ C(x), de exemplu, se transformă în formula ~B(x)V ~ C(x) V (B(x)LC(x)) Această formulă nu va fi o propoziție din cauza conjuncției (B(x) LC(x)) din ea Cu toate acestea, vom trata această conjuncție ca pe un singur literal și vom acționa formal ca și cum formula noastră ar fi o propoziție (nici Orez Graficul de respingere de exemplu unul dintre elementele conjuncţiei luate în considerare nu poate apărea în nici un set de unificare) În mod similar, transformăm propoziția ~D(x)V ~B(x) în tautologia ~D(x)V ~B(x)V (t>(x)Lx(x)) Prin îndeplinirea rezoluțiilor dictate de seturile de unificare corespunzătoare, construim graficul prezentat în Fig La vârful rădăcinii există o formulă a p {(Vx) [B (g (x)) L C (g (x))] V [D (f (g (x))) D Btf (g (x)))] V V [B(d(x)) LC(L(x)) P Vedem că aici afirmația reciprocă are o formă oarecum diferită de forma în care a fost făcută presupunerea Procesul de extragere a răspunsului S Locație Este ușor de observat că partea subliniată a răspunsului este similară ca formă cu întreaga ipoteză, doar că aici în loc de variabila x, referitor la cuantificatorul existențial, există g(x), iar în loc de variabila y, referindu-se la la un alt cuantificator existențial, există f(g(x) ) Dar în exemplul luat în considerare, în declarația de răspuns există un suplimentar l C(d(x))] V [D(fMx))) l B(f(g(x)))] ѵ [B(d(x)) l C(d(x))] Orez Graficul de demonstrație modificat, de exemplu propoziție telitivă [B(/i(x))A C(/i(%))] Această clauză este similară; la una dintre clauzele cuprinse în ipoteză, iar în locul variabilei x, referitor la cuantificatorul existențial, aici stă h(x) În general, dacă o presupunere este făcută în formă normală disjunctivă, atunci în procesul de extragere a răspunsului se creează o afirmație care este o disjuncție de expresii, fiecare dintre acestea având forma fie a întregii presupuneri, fie a uneia sau mai multor clauze de această presupunere Prin urmare, spunem că o astfel de afirmație poate fi Cap Aplicații ale calculului predicatului la rezolvarea problemelor să fie folosit ca "răspuns" la întrebarea reprezentată de ipoteza originală Situația care apare în cazul general poate fi descrisă exact Să presupunem că trebuie să demonstrăm o presupunere care are forma ( xi) ( xn) [ОFi (хі хн)V VWm (xb xn)l, unde fiecare termen Wi este o conjuncție de literali Aceasta înseamnă că fiecare termen Wi poate fi scris ca W} - Ln L Li L L Lup unde variabilele nu sunt specificate în mod explicit Negarea unei presupoziții duce la propoziții V ~A V VLup Lmi V ~ LmZ V ■ • • V l^mkm' După construirea graficului de infirmare, fiecare apariție a oricăreia dintre aceste propoziții este convertită într-o tautologie prin adăugarea negației propoziției Cu alte cuvinte, ei adaugă formule ale formei A L( A A Ajjj = Wi (xj, x , • •, xn) Astfel, la vârful rădăcină al grafului de infirmare transformat se va obține o declarație de răspuns, constând din disjuncții ale termenilor Wi, în care în locul variabilelor xi, , xn există diverse cazuri speciale că fiecare membru Wi poate să nu fie inclus deloc în declarația de răspuns și poate fi conținut în acesta o dată sau chiar de mai multe ori Astfel, nu este deloc necesar ca afirmația reciprocă să aibă forma exact ca și presupunerea IPOZIZE CARE CONTIN VARIABILE LEGATE DE CANTORUL GENERAL În cazul în care ipoteza de demonstrat conține variabile legate de cuantificatorul universal, apar dificultăți suplimentare Când sunt negate, astfel de variabile trec în variabile legate de cuantificatorul existențial, iar acest lucru duce la necesitatea introducerii funcțiilor Skolem Care ar trebui să fie interpretarea acestor funcții Skolem dacă în cele din urmă apar ca termeni în enunțuri reciproce? Ipoteze cu un cuantificator universal Să ilustrăm acest lucru cu un exemplu Punem axiomele sub formă de propoziții: ) C(x, p(x)): fiecare x este un copil al lui p(x) (Cu alte cuvinte, p este o funcție care asociază copilul individului cu individul însuși ) ) ~ C (x, y) V P (y, x): pentru toate x și y, dacă x este un copil al lui y, atunci y este părintele lui x Acum punem întrebarea: "Pentru orice x, cine este părintele său?" Ipoteza corespunzătoare acestei întrebări este (VxEg/) P (y, x) Transformând negația acestei presupuneri în forma de propoziții, obținem mai întâi (ExVy)~P(y, x), și apoi ~P(y,a), unde a este o funcție Skolem care nu conține argumente (adică o constantă) introdusă pentru a exclude cuantificatorul existenței nu Arborele de dovezi modificat pentru obținerea unei afirmații de răspuns niya care apare atunci când presupunerea este negata (Negarea ipotezei înseamnă că un individ a nu are părinți ) Arborele de demonstrație modificat, la vârful rădăcinii căruia este afirmația de răspuns, este prezentat în Fig " Cap Aplicaţii ale calculului predicat la rezolvarea problemelor În acest caz, obținem o afirmație P(p(a),a), care este destul de dificil de interpretat și conține funcția Skolem a Interpretarea ar trebui să spună că, indiferent de funcția Skolem a, care ar trebui să "încalce" validitatea ipotezei, putem, după cum se dovedește, să demonstrăm P(p(a),a) Cu alte cuvinte, orice individ pentru care presupunerea ar putea fi greșită satisface de fapt ipoteza Dovada prezentată în fig , va fi și adevărat dacă în loc de o constantă a luăm o variabilă Se poate arăta (Lackham și Nielson, ) că, în procesul de extragere a răspunsului, se poate înlocui întotdeauna orice funcții Skolem care apar atunci când presupunerea este infirmată de noi variabile În dovada modificată, nu se vor face substituții pentru aceste noi variabile, astfel încât acestea vor trece prin demonstrație neschimbate și vor apărea în declarația răspunsului final Hotărârile din dovada modificată vor fi în continuare doar rezoluțiile determinate de seturile de unificare corespunzătoare seturi de unificare care apar în cursul infirmarii inițiale În procesul unor rezoluții, variabilele pot fi redenumite, astfel încât poate o variabilă folosită în locul funcției Skolem va fi redenumită și, astfel, va deveni "strămoșul" noilor variabile în declarația de răspuns final Să demonstrăm câteva dintre fenomenele asociate cu această caracteristică folosind două exemple simple Exemplul Fie S compus dintr-o singură axiomă (sub forma unei "propoziții) P(b, w, (r)) V P(a, u, u) Trebuie să dovedim presupunerea (BxVzB"/)P(x, z, y) Arborele de respingere este prezentat în fig , a Propoziția rezultată din negația ipotezei noastre conține funcția Skolem g(x) Pe fig arată arborele demonstrației modificate, în care variabila t este utilizată în locul funcției Skolem g(x) Obținem dovada afirmației reciproce P(a, t, t) VP(b, z, z), ■ coincid (până la numele variabilelor) cu axioma noastră Acest exemplu arată modul în care noile variabile introduse de Ipoteze cu un cuantificator universal \ la redenumirea în procesul de rezoluție a variabilelor dintr-o propoziție Exemplul Să presupunem că trebuie să demonstrăm aceeași presupunere ca în exemplul anterior, dar acum pe baza Orez Arbori de probă, de exemplu din axioma P(z, u, z) V P(a, u, u) Arborele de respingere este prezentat în fig , a Propoziţia rezultată din negaţia ipotezei conţine funcţia Skolem g(x) Pe fig b arată un arbore de demonstrație modificat în care în loc de funcția Skolem g(x) Cap Aplicații ale calculului predicatului la rezolvarea problemelor se foloseşte variabila v Obținem dovada afirmației reciproce P(z, w, z) V P(a, w, w), coincid (până la numele variabilelor) cu axioma originală O analiză atentă a sub-unificatoare A Orez Arbori de dovadă, de exemplu Permutările din acest exemplu arată că, deși rezoluțiile din arborele modificat sunt limitate la seturile de unificare corespunzătoare, permutările utilizate în arborele modificat pot fi mai generale decât cele din arborele de respingere original În concluzie, iată pașii din procesul de extragere a răspunsului: Exemplu de scriere automată a programelor În cursul unui proces de căutare (enumerare), construim un grafic de infirmare bazat pe rezoluții și selectăm seturi de unificare în el În locul funcțiilor Skolem care apar în propozițiile care decurg din negația ipotezei, înlocuim noi variabile Transformăm propozițiile care decurg din negația presupunerii în tautologii atribuindu-le propriile negații Urmând structura graficului de infirmare original, construim graficul demonstrației modificate În fiecare rezoluție a graficului modificat, folosim setul de unificare determinat de setul de unificare utilizat pentru rezoluția corespunzătoare din graficul de infirmare Propoziția situată la vârful rădăcină al graficului modificat este declarația de răspuns extrasă în timpul procesului descris Este evident că afirmația reciprocă depinde de infirmarea din care a fost extrasă Poate că există mai multe respingeri diferite pentru aceeași problemă Din fiecare astfel de infirmare am putea extrage un răspuns și, deși unele dintre răspunsuri pot coincide, totuși, unele dintre afirmațiile care compun răspunsul se pot dovedi a fi mai generale decât altele De obicei, nu ne este posibil să stabilim dacă contra-afirmația extrasă dintr-o dovadă dată este cea mai generală Am putea, desigur, să continuăm să căutăm dovezi până când găsim o dovadă care să ofere un răspuns rezonabil de general Dar, din cauza indecidibilității calculului predicatului, nu este întotdeauna posibil să se stabilească dacă am găsit toate dovezile posibile pentru a p de formula Nr începând de la mulțimea S Această dificultate este, aparent, doar de interes teoretic În exemplele de mai jos, răspunsurile primite sunt destul de satisfăcătoare EXEMPLU DE SCRIERE AUTOMATĂ A UNUI PROGRAM Cu o formalizare adecvată, procesul de extragere a răspunsurilor descris mai sus poate fi utilizat pentru a construi automat programe de calculator simple La nivelul actual de dezvoltare a unor astfel de metode, metodele de demonstrare automată a teoremelor sunt potrivite pentru scrierea doar a celor mai simple programe Vom ilustra această abordare cu un exemplu Problema generală a sintezei automate a programelor este încă dincolo de capacitățile tuturor abordărilor disponibile în prezent ■ Cap Aplicații ale calculului predicatului la rezolvarea problemelor Să presupunem că vrem să scriem un program care ia x ca variabilă de intrare și produce o valoare y care satisface o relație R(x, y) ca rezultat Considerăm că interpretarea literei predicatului /? este definită de un set de axiome Alte axiome definesc funcții elementare din care ne vom construi programul (creând compoziții de funcții) Folosind procesul de extragere a răspunsurilor, demonstratorul teoremei va construi programul necesar dacă poate demonstra că ipoteza (Vx y) R(x, y) decurge logic din axiomele indicate După ce se găsește dovada lui -, răspunsul va conține y presupus ca o compoziție de funcții elementare Această compoziție de funcții va fi apoi un program Pentru a scrie programe interesante, trebuie să avem funcții elementare care să permită ramuri condiționate și fie iterația, fie recursiunea Limbajele de programare precum LISP ) fac posibilă scrierea de programe recursive Pentru a oficializa funcționarea funcțiilor care permit ramuri condiționate (cum ar fi funcția cond în LISP), este necesară fie capacitatea de a lucra cu o relație de egalitate, fie prezența unor reguli speciale de inferență În această carte nu ne ocupăm de problema relației de egalitate; nu este încă clar care dintre metodele propuse pentru abordarea egalității este acceptabilă (sau dacă vreuna dintre ele este acceptabilă) În unele cazuri, este posibil să ocoliți această dificultate și să creați programe recursive care se ramifică în timp ce se verifică condițiile de terminare Tehnicile folosite în aceste cazuri sunt explicate cel mai bine cu un exemplu concret Să presupunem că vrem să scriem un program care sortează o listă de numere de intrare Ieșirea ar trebui să fie o altă listă care să conțină aceleași numere în ordine descrescătoare Vom construi un program din funcțiile elementare car, cdr, cons și merge Primele trei dintre acestea sunt funcții elementare ale limbajului de programare LISP Ele sunt definite după cum urmează: car(x) are ca valoare primul element al listei x; cdr(x) are ca valoare acea parte a listei x care rămâne după eliminarea primului element din aceasta; cons(x, y) are ca valoare lista obtinuta prin plasarea x in fata listei y Ca o consecință a acestor definiții, obținem asta cons(car(x), cdr(x)) = x ') Pentru o descriere bună a limbajului LISP, vezi Weissman ( ) Un exemplu de scriere automată a unui program Nu este greu să vedem utilitatea utilizării acestor funcții ca o componentă a operațiunilor de listă mai complexe, cum ar fi programul de sortare pe care vrem să-l construim O altă funcție elementară, merge, pe care am ales-o, este semnificativ mai complexă decât primele trei Funcția de îmbinare are două argumente: primul este un element, iar al doilea este o listă sortată Valoarea merge(x, y) este o nouă listă care conține elementul x și toate elementele listei y, iar această nouă listă a fost deja sortată Astfel, merge(x, y) găsește locul potrivit în lista sortată y pentru a plasa elementul x acolo, astfel încât lista rezultată să nu fie nevoie să fie sortată Acum să formulăm "axiomele" care ne formalizează definițiile și raportul de intrare-ieșire necesar R(x, y) În primul rând, definim relația de sortare R(x,y) în termenii altor două relații: (VxVy) {{R (x, y)^{S (y) A / (x, z)}} A {{$ (y) D I (x, z)} =^R(x, z/)}} Sensul intuitiv al lui S(y) este că "lista y a fost deja sortată" Sensul relației I(x, y) este "cele două liste x și y conțin aceleași elemente (dar nu neapărat în aceeași ordine) " Oferim acum definiții (recurente) pentru S și / în ceea ce privește funcțiile elementare: (VxVyVu){I(x, y) ==> I(cons(u, x), merge(", i/))} /(nil, nil) (nil denotă o listă goală) (VxVy) (S (y) => S (imbinare (x, z))} S (nul) De fapt, definițiile - sunt oarecum mai slabe decât definiția intuitivă pe care am dat-o mai sus, dar sunt suficiente pentru a construi demonstrația') Setul de propoziții corespunzătoare formulelor bine formate de mai sus - este după cum urmează: la ~ R(x, y) - S(y) livre ~ R(x, y) V /(x, y) lc ~S(y)V ~/(x, y)VR(x, y) ~/(x, y) V / (cons (u, x), merge (u, y)) ') Axiomatizarea prezentată aici este în esență aceeași cu axiomatizarea propusă mai devreme de Robert Yeats de la Institutul de Cercetare Stanford Ch Aplicații ale calculului predicatului la rezolvarea problemelor (nul, nul) ~ S (z/) VS (imbinare (x, y)) S(nul) Strategia noastră este să încercăm să demonstrăm ($x y)R(x,y) prin inducție Vom demonstra această ipoteză pentru o listă de lungime zero, apoi presupunem că este adevărată pentru listele de lungime n și o vom demonstra pentru listele de lungime n + Rezultatul este o funcție recursivă care sortează o listă de lungime arbitrară , ~R(nil,y) - ^ (y}^~^ x, y) ѵ R(x, y) ~S(y) ѵ Orez Arborele de refutare pentru (Zu) R (nil, y) Demonstrând în acest fel, ajutăm semnificativ scrierea programului prin "încorporarea" unei verificări de ramificare condiționată pentru x = nil Dacă acest test este satisfăcut, mergem la programul generat de demonstrație pentru listele de intrare de lungime n = În caz contrar, mergem la programul generat de demonstrație folosind ipoteza de inducție O astfel de schemă simplifică exemplul nostru, deoarece ne eliberează de formalizarea funcțiilor condiționate și de introducerea relațiilor de egalitate necesare În cazul listelor de lungime n = , ipoteza poate fi formulată ca (E//) ?(n ,y) Negația sa va fi ~ ?(n , y) Arborele de respingere este prezentat în fig După extragerea răspunsului din acest arbore, obținem declarația de răspuns ? (nul, zero) Un exemplu de scriere automată a unui program Astfel, aici avem un rezultat oarecum banal: "Dacă lungimea listei x este , atunci y = zero" ~R(a,y) ѵ R(x,y) ~I(con (sag(a),sig(i)),y) ■ -/(cons(car(a),cdr(a)),yj v ~Sfy) \z~!(x,y) ~/fcdr(o),y) v ~S(merge(cnr(a),y)) ^\^^te^V,~^tey) ~S(merge(cnr(a)),y) v ~K(cdr(o),y) 'S\^S(țnergeJ^y)) v ~S(y) ~rt(cdr(e),y) v ~S(y) tey) ~"(cdr(a),y) V ~"tey) ' '\^^^^cdr(^^rt(cdrl?r))) nul Orez Arborele de refutare pentru (Vx y) R (x, y} Formulăm acum ipoteza de inducție: "Pentru fiecare listă nevidă x, valoarea cdr(x) poate fi sortată" Imaginați-vă că avem o funcție de sortare care poate sorta o listă mai mică Ipoteza de inducție sub formă de propoziție are forma R (cdr(x), sort(cdr(x))) Ch Aplicații ale calculului predicatului la rezolvarea problemelor Desigur, presupunem acum că x este zero, iar apelul la programul format din această parte a demonstrației are loc în cazul în care testul x = nil eșuează Pentru a demonstra (Vx ?/) R(x, y) avem nevoie de următoarea relație între car, cons și cdr: V x {cons (car (x), cdr (x)) = x) Din nou, pentru a evita dificultățile asociate cu predicatele de egalitate, introducem această relație sub forma unei propoziții ~ Nu? (contra (mașină (x), cdr (x)), //) VR (x, y) (De rețineți că această propoziție devine o tautologie după substituția x = cons (car(x), cdr(x)), a cărei validitate decurge din definiția funcțiilor car, cons și cdr ) Negarea ipotezei este - R (a, y) Aici a este o funcție Skolem care apare atunci când ipoteza conține variabile legate de cuantificatorul universal Graficul de respingere este prezentat în Fig Eliminând funcția a și transformând graficul de infirmare în mod obișnuit, obținem afirmația reciprocă R(x, merge(car(x), sort(cdr(x)))) Combinând ramura condiționată pe care am furnizat-o în prealabil și elementele create de demonstratorul de teoreme, ajungem la un program recursiv nil if'x = nі , merge (car(x), sort(cdr(x))) altfel UTILIZAREA CALCULULUI PREDICATULUI ÎN REZOLVAREA PROBLEMELOR ÎN SPAȚIUL DE STAT Dacă starea unei probleme poate fi determinată printr-un set de formule de calcul predicate bine formate, atunci această mulțime poate constitui o descriere a stării utilizate pentru rezolvarea problemei în spațiul stărilor Cu acest tip de descriere, operatorii spațiului de stare vor fi calcule care înlocuiesc un set de formule bine formate cu altul Setul de stări țintă poate fi apoi definit ca setul descris de orice set de formule a p din care urmează o formulă a țintă a p În mod similar, folosind formula de aplicabilitate, se poate determina setul de stări la care este aplicabil operatorul dat Într-un astfel de sistem de rezolvare a problemelor, s-ar putea sortx= Utilizarea calculului cu predicate pentru a rezolva probleme să utilizeze metodele de demonstrare a teoremelor în calculul predicatelor pentru a verifica îndeplinirea condiţiilor de realizare a scopului şi condiţiile de aplicabilitate a operatorilor ' Reprezentarea spațiului de stare pentru problema maimuțelor și bananelor prezentată în Cap poate fi ușor modificată astfel încât stările să fie descrise prin formule pp (Reamintim că în problema maimuțelor și bananelor, maimuța se află într-o cameră la un moment dat ai, în aceeași cameră la punctul b există o cutie Deasupra punctului de la podea, la o înălțime inaccesibilă, există un un buchet de banane ) Descrierea Deci a stării inițiale poate consta din patru formule p p : -ONBOX AT (caseta, b) AT (maimuță, a) -HB Predicatul ONBOX este T numai atunci când maimuța este deasupra cutiei; predicatul HB *) are valoarea T numai atunci când maimuța primește banane; predicatul'AT are o interpretare evidentă* ) Formula p p țintă va fi pur și simplu HB Orice descriere a stării din care urmează NV corespunde stării țintă Avem, ca și până acum, patru operatori: "apropiați-vă (și)", "deplasați (ѵ)", "cățărați" și "prindeți" Primele două sunt circuite operator; valoarea lor specifică depinde de valoarea variabilei circuitului La definirea fiecărui operator, elementele principale sunt: o formulă de aplicabilitate bine formulată care descrie condițiile în care este aplicabil acest operator; reguli pentru transformarea setului de formule a p care descriu starea la care este aplicat operatorul într-un nou set de formule a p care descriu starea rezultată Regulile de transformare pot fi specificate ca o listă de formule p p care trebuie eliminate și o listă de formule p p de adăugat; se presupune că acele formule pp care nu au fost eliminate rămân în noua descriere a stării Într-un astfel de limbaj, cei patru operatori ai noștri pot fi definiți după cum urmează: ■) Have banane (a avea banane) - Notă, trad ) Fii într-un anumit loc - Notă, trad Ch Aplicații ale calculului predicatului la rezolvarea problemelor vino (și) P p formula de aplicabilitate: - ONBOX Transformări eliminați: AT (maimuță, $) adăugați: AT (maimuță și) Aici simbolul $ stă în locul oricărui termen O formulă bine formată AT (maimuță, $) trebuie eliminată indiferent de valoarea lui $ Deoarece "abordarea (și)" este o schemă de operator, aplicația sa va oferi o schemă de descriere a stării care conține variabila și Atribuind acestei variabile o anumită valoare (constantă) și, obținem descrierea specifică a statului mutare (v) P p formula de aplicabilitate: Transformări retrage: adăuga: a urca P p formula de aplicabilitate: Transformări retrage: adăuga: - ONBOX L(Nx) [AT(maimuță,'x) LAT(box,x)] AT (maimuță, $) AT (cutie, $) AT (maimuță, v) AT (caseta, v) -ONBOX L(Eh)[AT(maimuță,x)LAT(box,x)] -ONBOX ONBOX apuca P p formula de aplicabilitate: Transformări retrage: adăuga: ONBOX L AT (caseta, c) -HB HB La formularea regulilor de ștergere și completări care determină transformarea formulelor p p efectuată de operatori, este necesar să se asigure că formulele p p retrase nu decurg din formulele p p neretrase, deoarece altfel aceste formule p p retrase formulele ar putea din nou să fie dedus Acum, căutarea stării țintă poate continua pe baza procesului standard de aplicare a operatorilor aplicabili Utilizarea calculului predicatului în rezolvarea problemelor Z la starea inițială Șo și la stările rezultate, până când se primește descrierea stării care conține predicatul HB țintă Deoarece folosim scheme de operator, acum vom construi un grafic al schemelor de descriere a stărilor (identic cu graficul din Figura ) Primul pas în procesul nostru de căutare (enumerare) va fi să aflăm dacă HB decurge din So Formal, această verificare poate fi realizată prin construirea negației p formula care trebuie demonstrată și apoi folosind metode de găsire a dovezilor bazate pe rezoluție pentru a deduce o contradicție Deoarece este evident că din {So} U HB nu se poate deduce nicio contradicție (nu sunt posibile rezoluții), concluzionăm că rezultatul verificării îndeplinirii condiției de realizare a scopului este negativ Următorul pas în cel mai simplu proces de iterație în spațiul de stare este acela de a afla care operator este aplicabil Din nou, se pot folosi metode de demonstrare a teoremelor bazate pe rezoluție Pentru fiecare operator s-ar putea încerca să demonstreze că formula de aplicabilitate a acestuia decurge din So Atunci am constata rapid că operatorul "grab" este inaplicabil Formulele de aplicabilitate bine formate pentru operatorii "urcăr" și "deplasare" sunt aceleași Negarea acestei formule generale pp de aplicabilitate (sub formă de propoziție) este ONBOXV ~ AT (maimuță, x) V ~ AT (casetă, x) O încercare de a deduce contradicția cu So și aici eșuează, astfel încât operatorii "urcăr" și "deplasare" nu se aplică nici la So- În final, vom reuși să dovedim că operatorul de abordare este aplicabil la So Folosind regula de transformare pentru operatorul "abordare (și)", ajungem la următoarea schemă de descriere a stării: -ONBOX AT (caseta, b) AT (maimuță, u) ~NV Acum procesul se repetă Mai întâi, aflăm dacă există un caz special al circuitului Si, din care formula ap țintă "НВ Evident nu În continuare, găsim operatori care pot fi aplicați în cazuri speciale ale circuitului S], De exemplu, la verificarea aplicabilității operatorului "mutare (v)", dorim să aflăm dacă există un caz particular al circuitului Si , din care rezultă formula a p ~ONBOXA (Hx ) AT (maimuță, x) L AT (cutie, x) Vedem că înlocuirea în S] în loc de b dă un caz special la care este aplicabil operatorul "mutare" Să numim asta privat cap Aplicații ale calculului predicatului la rezolvarea problemelor caz prin S' Asigurați-vă că și este înlocuit cu b în toate cazurile în care și apare în $i (În cazul nostru, există exact o apariție, dar ar putea fi mai multe ) Întrucât operatorul "deplasare" este aplicabil la SJ, operatorul "urcare" este aplicabil și lui S', dar operatorul "prindere" nu este aplicabil niciunui caz special al circuitului Sb În orice caz special al circuitului S! desigur, este aplicabil și operatorul de "abordare", dar utilizarea sa nu schimbă schema descrierii de stat Acum, dacă aplicăm operatorul "mutare (ѵ)" la SО, atunci obținem o schemă de descriere a stării -ONBOX AT (caseta, v) AT (maimuță, v) ~NV O altă schemă se obține dacă aplicăm operatorul "urcare" Acest proces continuă până când predicatul țintă este satisfăcut Ca rezultat, este creat un grafic care coincide ca formă cu graficul din Fig După aceea, nu este dificil să extragi secvența decisivă de declarații (cu valori specifice alese corespunzător ale variabilelor de circuit) Luând în considerare diferențele și utilizând operatori cheie, ca în Cap , o abordare bazată pe reducerea problemei la un set de subsarcini ar putea fi, de asemenea, utilizată pentru a rezolva această problemă Atunci condițiile de scop pentru subsarcinile formate ca urmare a unei încercări de a aplica operatori cheie ar fi formule p p pentru aplicabilitatea acestor operatori Folosind soluția prezentată în fig L , cititorul ar putea obține ceva experiență cu metoda de soluționare bazată pe reducerea problemei la un set de subprobleme și orientată către calculul predicatului O SINGURA FORMALIZARE PENTRU REZOLVAREA PROBLEMELOR ÎN SPAȚIUL DE STAT În secțiunea anterioară, stările au fost descrise folosind seturi de formule AP, iar descrierile de copii ale stărilor au fost obținute ca urmare a aplicării regulilor operatorilor pentru eliminarea și adăugarea formulelor AP Deoarece transformările asociate cu operatori mapează un set de formule p p cu alte seturi de formule p p , acestea au fost similare cu regulile de inferență De fapt, ele nu erau reguli de inferență adevărate, deoarece formulele p p copil nu sunt O singură formalizare pentru rezolvarea problemelor urmată logic din formulele p p părinte Transformările legate de operator au schimbat descrierile stărilor și au fost efectuate independent de sistemul de inferență în calculul predicatelor Cu o ușoară reformulare, este posibil să se includă descrierea acțiunilor operatorilor în cadrul formalismului calculului predicat Pentru a face acest lucru, adăugăm un termen de stare fiecărui predicat indicând starea căreia i se aplică predicatul, apoi în exemplul nostru anterior starea inițială So ar fi descrisă folosind setul de formule p p {~ ONBOX ($o), AT (box , b , s ), AT (maimuță, a, s ), ~HB(s )} Aici, termenul de stat este "o În această formulare, operatorii sunt priviți ca funcții care mapează o stare la alta Astfel, valoarea operatorului "grab(") va fi noua stare rezultată din aplicarea operatorului "grab(") la starea s Efectul principal al utilizării operatorului "grab" poate fi descris folosind formula p p (Vs) {ONBOX (s) A AT (carry, c, s)=^HB (grab (s))} înseamnă "pentru toate s, dacă maimuța este pe cutie și cutia este situată la c în starea s , apoi in starea rezultata din aplicarea operatorului "grab" la state s, maimuta va avea banane Cu acest tip de descriere, descrierile operatorilor sunt doar "axiome" suplimentare care pot fi combinate cu formule pp care descriu starea inițială S Dacă scopul nostru este să creăm o stare s care să satisfacă o anumită formulă p p țintă #(e), atunci această problemă poate fi rezolvată formal prin găsirea mai întâi a unei dovezi pentru conjectura (Bs)IT(e) și apoi folosind procesul de extragere a răspunsului pentru a obtine solutii Declarația de răspuns va conține o expresie pentru starea țintă sub forma unei compoziții de funcții operator Pentru a ilustra această abordare, vom folosi o formă simplificată a problemei maimuței și bananelor Să presupunem că avem doar trei operatori - "apucă", "urcă", "deplasează" - și condițiile de aplicabilitate a acestora sunt oarecum diferite de cele precedente (Această formă simplificată este cea mai potrivită pentru rezolvarea problemelor ilustrative De asemenea, cititorul este încurajat să lucreze cu versiunea cu patru operatori a problemei discutată în secțiunea anterioară ) Acțiunea acestor operatori poate fi descrisă prin următoarele formule p p : (VxVs) { ~ ONBOX => AT (box, x, move (x, s))}, adică "pentru toate x și s, dacă maimuța nu este pe cutie în starea $, atunci în starea $ , rezultând Ch Aplicații ale calculului predicatului la rezolvarea problemelor folosind operatorul "mutare(x)" pentru a afirma s, caseta va fi situată în punctul x (Vs){ONBOX (climb ($))}, adică pentru toți $ din starea rezultată din aplicarea operatorului "climb" la starea $, maimuța este pe cutie (V$){ONBOX(e) L AT (box, s, $)=>НВ (grab ("))}, adică pentru toți $, dacă maimuța este pe cutie și cutia este situată la punctul c în starea s, apoi în starea rezultată din aplicarea operatorului "grab" la starea s, maimuța va avea banane Pe lângă aceste axiome, trebuie exprimate în mod explicit și alte rezultate ale acestor trei afirmații, cum ar fi "poziția cutiei nu se schimbă atunci când maimuța se urcă pe ea" sau "la sfârșitul etapei de mișcare a cutiei, maimuța nu va fi încă în cutie" Deoarece demonstrația noastră necesită doar primul rezultat, îl scriem formal: (VxVs){AT (cutie, x, s)=^AT (cutie, x, urcare ($))} De asemenea, avem nevoie de o descriere adecvată a stării inițiale Deci: ~ONBOX(s ) Acum, a pune o întrebare în fața soluției noastre formale de probleme înseamnă doar a formula o presupunere (Hs) HB ($) În continuare, trebuie să transformăm axiomele de mai sus și negația ipotezei în formă de propoziții și să obținem arborele de infirmare prezentat în Fig Declarația de răspuns, extrasă în mod obișnuit din acest arbore, este instrucțiunea HB (apucă (urcă (deplasare (c, s )))) Aceasta arată că starea dorită este atinsă folosind o secvență de operatori {mută (c), urcă sus, apucă} Este interesant de comparat această abordare formală a rezolvării problemei cu metoda spațiului de stare (folosind calculul predicatelor pentru a verifica îndeplinirea condițiilor pentru atingerea scopului și aplicabilitatea operatorilor) discutată în secțiunea anterioară Abordarea formală are avantajul că nu este necesar un mecanism special pentru efectuarea calculelor operatorului Calculele sunt efectuate automat utilizând mecanismul deducției încorporat în demonstratorul teoremei Astfel, nu este necesară o iterație specială în spațiul de stare (sau o iterație la reducerea unei sarcini la subsarcini), cu excepția celor care O singură formalizare pentru rezolvarea problemelor sunt folosite în căutarea probelor (le vom lua în considerare în capitolul următor) Dar acest grad ridicat de uniformitate poate fi și un dezavantaj al metodei formale Nu este ușor să încorporați euristici speciale în iterația formală a demonstratorilor de teoreme care sunt utile pentru simplificarea procesului de aplicare a operatorilor în iterațiile în spațiul de stare ~HB(e) X ~ONBOX(e) ѵ ~AT(box,s,h) V HB(grip( )) ~ONBOX(e) V-AT (cutie, s, s) '^^\>^^^B X(urca B) A (B ==> A)] ) Concluzia poate fi scrisă ca Zi/Vx P (x, y, z) - există un element de identitate corect Pentru această teoremă, faceți următoarele: a) Transformați condițiile și negația concluziei în formă de propoziții b) Folosiți aceste propoziții pentru a obține o L-refutare c) Extrageți afirmația reciprocă din această infirmare (adică, obțineți o expresie pentru elementul de identitate corect) BIBLIOGRAFIE ALLEN, LAKHAM (ALLEN J , LUCKHAM D ) An Interactive Theorem-Proving Program, în B Meltzer și D Mi-chie (eds ), "Machine Intelligence ", - , American Elsevier Publishing Company, New York AMARELB (AMAREL S ) Proceduri de rezolvare a problemelor pentru analiza sintactică eficientă, ACM th Natl cont [cm de asemenea Sci Rept Nu , AFOSR Contr Nu AF ( )- , ] Mai multe despre Reprezentările problemei maimuței, Carnegie Institute of Technology Lecture Notes, martie An Approach to Euristic Problem-Solving and Theorem Proving in the Propositional Calculus, în J Hart și S Takasu (eds ), "Systems and Computer Science", University of Toronto Press, Toronto On Representations of Problems of Reasoning About Actions, în D Michie (ed ), "Machine Intelligence ", - , American Elsevier Publishing Company, Inc , New York Despre reprezentarea problemelor şi a procedurilor dirijate în scopuri pentru Computere, Comun A m soc Cybernelics, , nr ANDERSON, BLEDSOE (ANDERSON R , BLEDSOE W ) A Linear Format for Resolution with Merging and a New Technique for Establishing Completeness, J ACM, , nr BAR HILLEL Y Universal Semantics and Philosophy of Language: Quandaries and Prospecte, în Jaan Puhvel (ed ), "Substance and Structure of Language", University of California Press, Berkeley VELLMAN, DREYFUS (BELLMAN R" DREYFUS S ) Programare dinamică aplicată, Princeton University Press, Princeton, NJ BELLMORE, NEMHAUSER (BELLMORE M "NEMHAUSER G ) The Travelling Salesman Problem: A Survey, Operations Res , , nr , - BANERJI R Theory of Problem Solving: An Approach to Artificial Intelligence, American Elsevier Publishing Company, Inc , New York [Traducere în limba rusă: Teoria rezolvării problemelor Abordarea creării inteligenței artificiale, Mir, Moscova, ] BERG (BERGE S ) Theory of Graphs and Its Applications, Dunod, Paris (în franceză, limba) [Traducere în limba rusă: Teoria graficelor și aplicațiile sale, IL, M , ] Bibliografie BERNSTEIN și alții (BERNSTEIN A și colab ) Un program de joc de șah pentru computerul IBM , Proc Vest Joint Computer Conf , pp - NEGRU (NEGRU F ) A Deductive Question-Answering Systern, Teză de doctorat, Harvard Vezi, de asemenea, M Minsky (ed ), "Semantic Information Processing", - , The MIT Press, Cambridge, Mass , BOBROV "(BOBROW D ) a Intrare în limbaj natural pentru un sistem de rezolvare a problemelor computerului, disertație de doctorat, Massachusetts Institute of Technology Vezi, de asemenea, M Minsky (ed ), "Semantic Information Processing", The MIT Press, Cambridge, Mass, Un sistem de întrebări-răspuns pentru problemele de cuvinte de algebră din liceu, în Proc AFIPS Fall Joint Computer Conf , - MINGE (MINGE W ) Mathematical Recreations and Essays, ed lOth, Macmillan and Co , Ltd , Londra ( -puzzle, pp - ; Turnul-Hanoi, pp - ) WEISSMAN C LISP Primer, Dickenson Publishing Company, Inc , Belmont, California BOC, CARSON, ROBINSON (WOS L " CARSON D " ROBINSON G ) Strategia preferințelor unităților în demonstrarea teoremei, Proc AFIPS Fall Joint Computer Conf , voi , pp - BOC, ROBINSON, CARSON (WOS L "ROBINSON G" CARSON D ) Eficienţa şi completitudinea setului de strategie de sprijin în teorema-demonstrare, J ACM, , nr , - HARVEY, KLING (GARVEY T" KLING R ) Ghidul utilizatorului pentru QA Question-Answering System, Stanford Research Institute Artificial Intelligence Group Nota tehnică GUARD și alții (GUARD J și colab ) Matematică semi-automatizată, J ACM, , nr , - GARDNER M The Scientific American Book of Mathematical Puzzles and Diversions, Simon și Schuster, New York A doua carte științifică americană de puzzle-uri și diversiuni matematice, Simon și Schuster, New York , a, b, în Jocuri matematice, Sci Am , , nr , - (februarie ); , nr , - (martie ); , nr , - (iunie ); , nr , - (septembrie ) GELERNTER H Realizarea unei mașini de demonstrare a teoremei de geometrie, Proc Intern Conf informa Proc , pp - , Casa UNESCO, Paris Vezi, de asemenea, Feigenbaum E , Feldman J ( ), pp - GELERNTER, HANSEN, LOVELAND (GELERNTER H "HANSEN s ' , LOVE-LAND D ) Explorări empirice ale mașinii de demonstrare a teoremei de geometrie, Proc Vest Joint Computer Conf , voi , pp - Vezi, de asemenea, Feigenbaum E , Feldman J ( ), pp - Bibliografie GOL OMB, BOMERT (GOLOMB S" BAUMERT L ) Programare Backtrack, ACM, , nr - VERDE (VERDE S ) a Teorema-Demonstrarea prin Resqlution ca bază pentru sistemele de întrebări-răspuns, în B Meltzer și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York The Application of Theorem-Proving to Question-Answering Systems, teză de doctorat, "Departamentul de inginerie electrică, Universitatea Stanford A se vedea, de asemenea, Stanford Artificial Intelligence Project Memo AI- , iunie b Aplicarea demonstrării teoremei la rezolvarea problemelor, în Donald E IValker și Lewis M Norton (eds ), Proc Intern Conf comună Inteligența artificială, Washington, DC VERDE, RAPHAEL (VERDE C" RAPHAEL B ) Utilizarea tehnicilor de demonstrare a teoremelor în sistemele de întrebări-răspuns, Proc ACM Natl Conf , pp - , Brandon Systems Press, Princeton, NJ GREENBLATT R şi colab Programul de șah Greenblatt, Proc AFIRS Fall Joint Computer Conf , pp - Anaheim, California BUN (BUN I ) A Five-Year Plan for Automatic Chess, în E Dale și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York DE RUSSO, ROY, CLOSE (DE RUSSO P " ROY P " CLOSE C ) State Variables for Engineers, John Wiley and Sons, Inc , New York DIIKSTR (DIJKSTRA E ) A Note on Two Pfoblems in Connection with Graphs, Numerische Math , , - DORAN J An Approach to Automatic Problem-Solving, în N Collins și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York New Developments of the Graph Traverser, în E Dale și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York DORAN, MICHIE (DORAN J , MICHIE D ) Experimente cu programul Graph Traverser, Proc Roy Soc , A, , - DREYFUS C (DREYFUS S ) An Appraisal of Some Shortest Path Algorithms, Operations Res , , nr , - DREYFUS X (DREYFUS H ) Alchemy and Artificial Intelligence, Rând Corporation Paper P {AD ) Bibliografie DUDENEY N ' The Canterbury Puzzles, Dover Publications, Inc , New York [Publicat inițial în ] Puzzles and Curious Problems, Martin Gardner (ed ), Charles Scribner's Sons, New York [Bazat pe două cărți de Dudenay: Modern Puzzles, și Puzzles and Curious Problems, ] DAVIS, PUTNAM (DAVIS M " PUTNAM H ) A Computing Procedure for Quantification Theory, ACM, , nr DALE, MICHIE (ed ) Machine Intelligence , American Elsevier Publishing Company, Inc , New York ZOBRIST (ZOBR ST A ) A Model of Visual Organization for the Game of Go, Proc AFIPS Spring Joint Computer Conf , pp - YATES, RAPHAEL, HART (YATES R , RAPHAEL B" HART T ) Resolution Graphs, Artificial Intelligence, , nr JELINEK F Algroithm de decodare secvențială rapidă folosind o stivă, IBM J Res Develop , , nr , - QUINLAN, HUNT (QUINLAN J" HUNT E ) A Formal Deductive Problem-Solving System, I ACM, , nr , - KIEBERTS, LUCKHAM (KIEBURTZ R" LUCKHAM D ) Compatibilitatea rafinărilor principiului rezoluției (în presă) KISTER și alții (KISTER J și colab ) Experimente în șah, I ACM, , nr , - KOWALSKI R a Search Strategies for Theorem-Proving, în B Meltzer și D Mich'ie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York Studii în completitudinea și eficiența demonstrației teoremei prin rezoluție, teză de doctorat, Universitatea din Edinburgh KOWALSKI R , HAYES P Semantic Trees in Automatic Theorem-Proving, în B Meltzer și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York COLLINS, MICHIE (ed ) (COLLINS N " MICHIE D ) Machine Intelligence , American Elsevier Publishing Company, Inc , New York KOTOK (KOTOK A ) Un program de joc de șah pentru IBM , nepublicat, teză B S , Massachusetts Institute of Technology, Catnbridge, Mass COLES LS Un sistem de întrebări-răspunsuri on-line cu limbaj natural și intrare picturală, Proc ACM Natl Conf , , pp - , Brandon Șystems Press, Princeton, NJ- Bibliografie CAMPBELL D Blind Variation and Selective Survival as a General Strategy in Knowledge-Proceses, în M Yovits și S Cameron (eds ), Self-Organizing Systems, pp - , Pergamon Press, New York [Traducere în limba rusă: Sisteme de auto-organizare, Mir, Moscova, ] LOVELAND D A Linear Format for Resolution, Departamentul de Informatică al Universității Carnegie-Mellon Raport, decembrie Vezi și Proc IRIA Symp Autom Demonstrație, Note de curs la Matematică Nr , Springer-Verlag New York, Inc , New York, LUCKHAM D The Resolution Principie in Theorem-Proving, în N Collins și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Co , Inc Refinement Theorems in Resolution Theory, Stanford Artificial Intel-ligence Project Memo AI- , martie Vezi, de asemenea, Proc IRIA Symp Autom Demonstrație, Note de curs de matematică nr , Springer-Verlag New York, Inc , New York, LUCKHAM, NILSON (LUCKHAM D "NILSSON N ) Extragerea informațiilor din arbori cu dovezi de rezoluție, inteligență artificială LIN SHEN Soluții computerizate ale problemei vânzătorului ambulant, Beli Syst Tehn XLIV, nr Tehnici euristice pentru rezolvarea combinatoriilor mari! Problems on a Computer, în R Banerji și M Mesarovic (eds ), "Theoretical Approaches to Non-Numerical Problem-Solving", pp - , Springer-Verlag New York, Inc , New York LAWLER, LEMN (LAWLER E " WOOD D ) Branch and Bound Methods: A Survey, Operations Res , , Nr , - LONDRA R Bibliography on Proving the Correctness of Computer Programs, în B Melțzer și D Michie (eds ), "Machine Intelligence ", pp - , American Elsevier Publishing Company, Inc , New York McCULLOCH, PITTS (McCULLOCH W S " PITTS W ) A Logica! Calculul ideilor immanente în rețelele neuronale, Bull Matematică Biophys , , - McCarthy J Programe cu bun simţ, în "Mecanizarea proceselor de gândire", voi I, pp - , Proc Simp , Nat Fiz Lab, Londra, nov - , Vezi, de asemenea, M Minsky (ed ), Semantic Information Processing, pp - , The MIT Press, Gambridge, Mass , Spre o știință matematică a calculului, Proc IFIP Congr , North Hoiland Publishing Company, Amsterdam Situații, acțiuni și legi cauzale, Inteligența artificială de la Universitatea Stanford nota de proiect Nu Vezi, de asemenea, M Minsky (ed ), "Semantic In-formation Processing", - , The MIT Press, Cambridge, Mass , A Tough Nut for Proof Procedure, Memo privind proiectul de inteligență artificială de la Universitatea Stanford Nu , Bibliografie McCarthy, HAYES (McCARTHY J " HAYES R ) ' Some Philosophical Problems from the Standpoint of Artificial Intel-ligence, în B Meltzer și D Michie (eds ), "Machine Intelligence ", - , American Elsevier Publishing Company, Inc , New York MANA (MANA Z ) Corectitudinea programelor, Computer Syst Sci , (mai ) [traducere în limba rusă; Manna , Corectitudinea programelor, colecția cibernetică, nr , serie nouă, Mir, M, ] Corectitudinea programelor non-deterministe, Inteligența artificială, voi , nr MANNA, WOLDINGER (MANA Z "WALDINGER R ) Spre sinteza automată a programelor, Comun ACM (aprilie ) MELTZER B Demonstrarea teoremei pentru Computere: Câteva rezultate privind rezoluția și redenumirea, Comp Jt , - Some Notes on Resolution Strategies, în D Michie (ed ), "Machine Intelligence ", - , American Elsevier Publishing Company, Inc , New York MELTZER, MICHIE (ed ) (MELTZER V , MICHIE D ) Machine Intelligence , American Elsevier Publishing Company, Inc , New York Machine Intelligence , American Elsevier Publishing Company, Inc , New York Machine Intelligence , American filsevier Publishing Company, Inc , New York MENDELSON (MENDELSON E ) Introduction to Mathematical Logic, D Van Nostrand Company, Inc , Princeton, New Jersey [Traducere în limba rusă: Introducere în logica matematică, "Nauka", M , ] MINSK (MINSKY M ) a Pași către inteligența artificială, Proc IRE, , - (ianuarie d) Vezi, de asemenea, Feigenbaum E & Feldman J ( ), pp - A Selected Descriptor-Indexed Bibliography to the Literature on Artificial Intelligence, IRE Trans Factori umani Electron, HFE- , pp - , martie Pentru o versiune revizuită, vezi Feigenbaum, E , Feldman, J ( ), pp - Calcul: mașini finite și infinite, Prentice-Hall, Inc , Englewood Cliffs, NJ (ed ) Semantic Information Processing, The MIT Press, Cambridge, Mass MINSKI, PEIPERT (MINSKY M " PAPERT S ) Perceptrons: An Introduction to Computational Geometry, The MIT Press, Cambridge, Mass [Traducere în limba rusă: Perceptrons, Mir, Moscova, ] MICHIE (ed ) (MICHIE D ) Machine Intelligence , American Elsevier Publishing Company, Inc , New York Bibliografie MICHIE, ROSS (MICHIE D" ROSS R ) Experimente with the Adaptive Graph Traverser, în B Meltzer și D Michie (eds ), "Machine Intelligence ", - , American Elsevier Publishing Company, Inc , New York MOSES J Integrare simbolică, teză, Proiect MAC, Raport MAC-TR- , Massachusetts Institute of Technology MONTANARI U Căutarea ghidată euristic și potrivirea cromozomilor, Inteligența artificială, , nr MOORE (MOORE E ) Cea mai scurtă cale printr-un labirint, Proc Intern Symp Theory Switching, Part II, April - , ; The Annals of the Computation Laboratory of Harvard University , Harvard University Press, Cambridge, Mass , NILSSON N Searching Problem-Solving and Game-Playing Trees for Minimal Cost Solutions, jn AJH Morrell (ed ), "Information Processing ", voi , - , North-Holland Publishing Company, Amsterdam NEWELL A Limitations of the Current Stock of Ideas about Problem Solving, în A Kent și O Taulbee (eds ), "Electronic Information Handling", Spartan Books, Washington, DC Programare euristică: Probleme prost structurate, în J Aronofsky (ed ), "Progress in Operations Research", voi , John Wiley and Sons, Inc NEWELL, SHOW, SIMON (NEWELL A , SHAW J , SIMON H ) Empirica] Explorations of the Logic Theory Machine, Proc Vest Joint Computer Conf , voi , pp - Vezi şi: E Feigenbaum, J Feldman ( ), p IZ- Programe de joc de șah și problema complexității, IBM I Res Develop , , - (octombrie ) Vezi, de asemenea, Feigenbaum E & Feldman J ( ), pp - Raport asupra unui program general de rezolvare a problemelor, Proc Intern Conf informa Proces , pp - , Casa UNESCO, Paris O'BEIRNE TH Puzzles and Paradoxes, New Scientist, ( iulie ), ( august ) OPE (ORE O ) Teoria graficelor, Am Matematică soc coloc PubL, voi , Providence, Insula Rhole [Traducere în limba rusă: Teoria graficelor, Nauka, Moscova, ] Graphs and Their Uses, Random House, New York [Traducere în limba rusă: Grafice și aplicarea lor, "Mir", M , ] PEYPERT (HÂRTIE S ) Inteligența artificială a lui Hubert L Dreyfus A Budget of Fal- lacies, MIT Artificial Intelligence Memo No POLYA G How to Solve It, a -a ed , Doubleday and Company, Inc , Garden City, NY [traducere în limba rusă: Cum se rezolvă o problemă? Uchpedgiz, M , ] POHL (POHL I ) Căutare bidirecțională și euristică în probleme de cale, Teză de doctorat Departamentul de informatică, Universitatea Stanford, Stanford, California Cm, de asemenea Stanford Linear Accelerator Center Raportul nr , mai Bibliografie First Results on the Effect of Error- in Heuristic Search, în B Me lt-zer și D Michie (eds ), "Machine Intelligence ", - , American Elsevier Publishing Company, New York PRAWITZ D An Improved Procedure, Theoria, , - RUSSELL (RUSSELL R ) ' • Kalah - Jocul și programul, - Nota proiectului de inteligență artificială a Universității Stanford nr sept , RAPHAEL B a SIR: A Computer Program for Semantic Information Retrieval, Teză de doctorat, Massachusetts Institute of Technology Vezi, de asemenea, M Minsky (eds ), Semantic Information Processing, The MIT Press, Cambridge, Mass , Un program de calculator care "înțelege", Proc AFIPS Fall Joint Computer Conf , - RIGNEY, ORAȘUL (R GNEY J W " TOWNE DM) Tehnici computerizate de analiză a microstructurii muncii în serie în industrie, Factori umani, , nr , - RISCH RH Problema integrării în termeni finiţi, trad A m Matematică Soc , , - ROBBIN J Logica matematică: un prim curs, W A Benjamin, Inc , New York ROBINSON, BOC (ROBINSON GA, WOS LT) Paramodulation and Theorem-Proving in First-Order Theories with Equality, în B Meltzer și D Michie (eds ), "Machine Intelligence ", - , American Elsevier Publishing Company, Inc , New York ROBINSON, BOC, CARSON (ROBINSON GA, WOS L T " CARSON DF) Unele strategii de demonstrare a teoremelor și implementarea lor, Memorandumul Tehnic al Laboratoarelor Naționale Argonne Nr - ROBINSON J (ROBINSON JA) a O logică orientată pe mașină bazată pe principiul rezoluției, I ACM, , nr , - [Traducere în limba rusă: vezi colecția Cybernetic, nr , Seria nouă, "Mir", M , ] Deducere automată cu hiper-rezoluție, stagiar I Comp Math , - , ' Procese euristice și complete în mecanizarea Theorem-Proving, în JT Hart și S Takasu (eds ), "Systems and Computer Science", - , University of Toronto Press, Toronto The Generatized Resolution Principie, în D Michie (ed ), "Machine Intelligence ", - , American Elsevier Publishing Co , Inc , New York a New Directions in Mechanical Theorem Proving, în AJH Morrell (ed ), "Information Processing ", voi , - , North-Holland Publishing Company, Amsterdam Mechanizing Higher Order Logic, în B Meltzer și D Michie (eds ), "Machine Intelligence ", American Elsevier Publishing Company, Inc , New York An Overview of Mechanical Theorem Proving, în R Banerji și M Mesarovic (eds ), "Theoretical Approaches to Non-Numerical Problem Soi"ving, - , Springer-Verlag New York, Inc , New York Bibliografie ROSENBLATT (ROȘENBLATT F ) Principles of Neurodynamics, Spartan Books, New York [Traducere în limba rusă: Principii de neurodinamică Perceptronii și teoria mecanismelor cerebrale, "Mir", M , ] SELFRIDGE, KELLY (SELFRIDGE O , KELLY J" Jr ) Sophistication in Computers: A Disagreement, IRE Trans informa Teorie, IT- , nr , - SIMMONS R Răspunzând la întrebări în limba engleză prin computer: un sondaj, comun ACM, , - (ianuarie ) Sisteme de răspuns la întrebări în limbaj natural: , Commum ACM, , nr , - SLAGLE J A Computer Program for Solving Problems in Freshtnan Calculus (SAINT), Teză de doctorat, Massachusetts Institute of Technology, Cambridge, Mass Vezi, de asemenea, Raportul Lincoln Laboratory G- , mai a Un program euristic care rezolvă problemele de integrare simbolică în calculul bobocului, I ACM, , nr , - Vezi, de asemenea, Feigenbaum E , Feldman J ( ) Game Trees, M și N Minimaxing și procedura M și N Alpha-Beta, Raportul Grupului de Inteligență Artificială nr , UCRL- , Laboratorul de radiații Lawrence al Universității din California, Livermore, California Experimente cu un program deductiv de răspuns la întrebări, comun ACM, , - (decembrie ) Demonstrarea teoremei automate cu rezoluție semantică redenumibilă, I ACM, , nr , - (octombrie ) Euristic Search Programs, în R Banerji și M Mesarovic (eds ), "Theoretical Approaches to Non-Numerical Problem Solving", pp - , Springer-Verlag New York, Inc , New York SLAGEL, BURSKY (SLAGLE J , BURSKY P ) Experimente cu un program euristic multifuncţional, de demonstrare a teoremei, I ACM, , nr , - SLAIGLE, DIXON (SLAGLE J " DIXON J ) Experimente cu unele programe care caută în arbori de jocuri, I ACM, , nr , - Experimentele cu M și N Tree Search Program, Commun ACM, , nr , SOLOMONOV R SOLOMONOFF Câteva lucrări recente în inteligența artificială, Proc IEEE, , nr , decembrie SAMUEL A Unele studii în învățarea automată folosind jocul damelor, IBM I Res Dezvoltare, , nr , - Vezi, de asemenea, Feigenbaum E , Feldman J ( ), pp - Câteva studii în învățarea automată folosind jocul dame II Progres recent, IBM I Res şi Develop , , Nr , - SANDWALL (SANDEWALL E ) ■ Concepts and Methods for Euristic Search, în Donald E Walker și Lewis M Norton (eds ), "Proc Intern Conf comună Inteligența artificială, Washington, DC Bibliografie TRAVIS (TRAVIS L ) USD Valoarea introspecției pentru tije Designer of Mechanical Problem-Solvers, Behav Sci-, , nr , - Psihologie și bionică: multe probleme vechi și câteva mașini noi, Conf Record Winter Conv Electron aerospațial Sys (WINCON), Publicația IEEE nr -C- , voi VI TURING (TURING AM) Computing Machinery and Intelligence, Mind, , - (octombrie ) Vezi, de asemenea, Feigenbaum E , Feldman J ( ) WHITNEY D State Space Models of Remote Manipulation Tasks, în Donald E Walker și Lewis M Norton (eds ), "Proc Intern Conf comună Artificial Intel-ligence, - , Washington, DC WALDINGER, LEE (WALDINGER R , LEE R ) PROW: A Step Toward Automatic Program-Writing, în Donald E Walker și Lewis M Norton (eds ), "Proc Intern Conf comună Inteligența artificială, Washington, DC FIKES (FIKES R ) Ref-Art: A System for Solving Problems Stated as Procedures, Artificial Intelligence, , nr FEIGENBAUM (FEIGENBAUM E ) Cercetări de inteligență artificială, IEEE Trans informa Teorie, IT- , nr , - Artificial Intelligence: Themes in the Second Decade, în AJH Morrell (ed ), "Information Processihg ", voi , - , North-Holland Publishing Company, Amsterdam Vezi, de asemenea, nota de proiect de inteligență artificială a Universității Stanford nr , aug , FEIGENBAUM, BUKHANAN LEDEBERG (FEIGENBAUM E " BUCHA-NAN B " LEDERBERG J ) Generality and Problem Solving: A Case Study Using the DEN-DRAL Program, în B Meltzer și D Michie (eds ), "Machine Intelligence ", American Elsevier Publishing Company, Inc , New York FEIGENBAUM, FELDMAN (ed ) (FEIGENBAUM E , FELDMAN J ) Computers and Thought, McGraw-Hill Book Company, New York [Traducere în limba rusă: Mașini de calcul și gândire, "Mir", M , ] FELDMAN, GRIS (FELDMAN J "GRIES D ) Translator Writing Systems, Commun ACM, , nr , - FLOYD R a Algoritmi nedeterministi, I ACM, , nr , - Atribuirea semnificațiilor programelor, Proc Symp Appl Matematică A m Matematică Soc , voi , - FOGEL, OWENS, WALSH (FOGEL L " OWENS A , WALSH M ) Inteligența artificială prin evoluție simulată, John Wiley and Sons, Inc , New York FORD, FULKERSON (FORD L " Jr " FULKERSON D ) Flows in Networks, Princeton University Press, Princeton, • NJ [traducere în limba rusă: Flows in networks, Mir, M , ] Bibliografie HART, NILSSON, RAPHAEL (HART P "NILSSON N" RAPHAEL V ) O bază formală pentru determinarea euristică a căilor de cost minim, IEEE Trans Sys sci Cibernetica, SSC- , nr , - BISERICA A Introducere în logica matematică, voi , Princeton University Press, Princeton, NJ SHAPIRO (SHAPIRO D ) Algoritmi pentru rezolvarea problemei costului optim al vânzărilor de călătorie, Sc Teză de doctorat, Universitatea Washington, St Louis, 'Mo SHANNON C Programing a Digital Computer for Playing Chess, Philosophy Magazine, , - (martie, ) Vezi și JR Newman (ed ), The World of Mathematics, voi , Simon and Schuster, New York, [Traducerea rusă: vezi Lucrări despre teoria informației și cibernetica, IL, M , ] SCHUH F The Mașter Book of Mathematical Recreations, WJ Thieme and Cie , Zutphen, (în olandeză) Traducere în engleză: F Gobel, Dover Publications, Inc , New York, EDWARDS, HART (EDWARDS D "HART T ) Memo-ul euristic a-₽, MIT Artificial Intelligence Memo nr oct , [Publicat inițial ca The Tree Prune (TP) Algo-rithm, Dec , ] ANDREWS (ANDREWS P ) Rezoluție cu fuziune, / ACM, , nr , - Vezi, de asemenea, modificările din / ACM, , nr , (octombrie ) HERBRAND J Recherches sur la theorie de la demonstration, Trav soc sci Lettres Varsovie, Class III Sci Matematică Fizic, nu ERNST (ERNST G ) Condiții suficiente pentru succesul bf GPS, I ACM, , Nr , - ERNST, NEWELL (ERNST G , NEWELL A ) GPS: A Case Study in Generality and Problem Solving, ACM Mono-graph Series, Academic Press, Inc , New York INDEX DE NUME Adelson-Velsky G M Allen J Amarel (Amarei S ) , , , , , Anderson R Bar Hillel Y Wellman R Bellmore M , Banerji R Berge (Berge S ) Bernstein A Bledsoe W Negru (Negru F ) , Bobrov D Mingea W Baumert L Buchanan V Bursky (R Bursky) , , Weissman S Boc (Wos L ) , , , Wood D , Garvey T Garda J Gardner M " Gelernter N , Golomb S Verde (Verde S ) , , Greenblatt R Gries D Bun I De Russo (De Russo R ) ' Dijkstra E Dixon J , - Doran J , Dreyfus S Dreyfus H , Dudeney N ) Davis (Davis M ) Zobrist (Zobrist A ) Yates R , , , Jelinek F Quinlan J Kelly J , jr ani Kieburtz R Kister J Kling (Kung R ) Închide C Kowalski R , , , Kotok A Coles LS Campbell D Loveland D , Luckham D , , , , , Levin N Lederberg J Lee R Lin Shen Lawler E , Londra R McCulloch WS McCarthy J , , , , , , , , Mana Z , , Munson J Meltzer B Mendelson E Minsky M , , , Michie D , , Moise J , Montanari U Moore (Moore E ) Nilsson N , , , , Nemhauser G , Novikov P S Newell A , , , , , , , , , Index de nume O'Byrne (O'Berne T N ) Ore (minereu O ) Towne D M Travis L Turing dimineața* Papert S , Pitts W Polya G Paul (Pohl I ) Prawitz D Putnam N Russell R Rafael V , , , , , , Rigney JW Risch R H , Robbin J , Robinson G A , , , Robinson J A , , , , Rosenblatt F Roy R Ross R Whitney D Waldinger R Fikes R , , Fulkerson D Feigenbaum E , Feldman J , Floyd R , Fogel L Ford L , jr Hunt E Hart R (Hart R ) , , , Hart T (Hart T ) , , Hayes R , , Biserica A Simon (Simon N ) , , , , Selfridge O Siberian (Siberz J K ) Simmons R Slagle J , , , , , - , - , , Solomonoff R Samuel (Șamuel A ) , , - Sandewall E Shapiro D , Shannon S Shaw J , , , , Schuh F Edwards Andrews R , Herbrand J , Ernst G , , INDEX SUBIECTULUI axioma algoritm de programare dinamică - admisibil , - nedeterminist - unificarea - enumerarea ordonată versiunea alfabetică procedura alfa-beta , tăierea alfa atomul , formula atomică copac m-ary infinit tăiere beta constantă de litere - propozițional culmea - iesire - realizabil - copil , - final - închis - "Eu" - "SAU" - rădăcina , - sfârşitul , - initial , , - nefavorabil - neînchis - de nerezolvat , - deschis - rezolvabil - parental , adâncimea superioară , , , - limita - negări - expresie integrantă relație profundă gramatică - coloana - dovezi bazate pe rezoluțiile - ȘI/SAU , - regizat - căutare arborele , - jocuri - ȘI/SAU - închis - optim - căutare , - propozițional - potențialul de soluții - semantică disjuncție dovadă arc , - nerambursabil problema maimuțelor și bananelor , , - aproximativ opt regine , - * - vânzător , -ulcioare -misionari și canibali - pendul inversat -Piramida -dreptunghiuri glisante - obținerea de răspunsuri la întrebările - distribuții - integrare simbolică - analiza - management joc la opt - cincisprezece - du-te - Grandi - Kalah , - Cubul - "ultimul pierde" - tic-tac-la , - - șah - dame jocuri variabile individuale interpretare calculul predicatelor cuantificator universal ■-existenta Index de subiect logica clasica controlul atentiei configuratia initiala - ținta conjuncția rădăcina arborelui literal consecință logică viță de vie macrooperatori matricea metoda ramurilor și legate - căutare în profunzime , , - căutare exhaustivă , , , - încercare și eroare , - prețuri egale , - tabele de adevăr set de nepotrivire - unificarea - unificat - ținta modelul , , , impracticabilitatea (nemultumirea) insolubilitate forma normala conjunctivala ■ preliminar valoarea inversată - - preliminar valabilitate valoare operator - cheia - mostenire - nedeterminist - construirea nodurilor copil - prefixul - sarcini ALL SELECT , - reducerea sarcinii la subsarcini descriere copil (rezultat) stări intermediare de bază afirmație reciprocă care filtrează vârfurile anterioare funcţia de evaluare , , •- - static caută în profunzime - plin - orb - comandat - etape perceptron suport subproblemă subcaz căutare (forță brută) - în adâncime descendent regulile de rescriere , - enumerarea întrerupe formulă bine formată (formula p p ) , teza , , - baza - retras - original - pozitiv ghici - despre consistența strămoșul prefixul principiul rezoluției atribuirea valorii problema cadru de referință program nedeterminist - Mack Hack programare înapoi produse întoarcere înapoi spațiu de stare -cel mai înalt nivel proces de respingere procedura minimax - marcaje ale vârfurilor rezolvabile și nerezolvabile calea , - optim diferențe rezoluție vârf - perechi de propoziții deschiderea topului , marginea reducerea problemei rezoluția , rezoluția rezoluția secvență de decizie grafic de decizie rezolvarea problemelor reducerea unei sarcini la subsarcini semantică , Index de subiect sintaxa , îmbinare starea inițială - ținta etape de referință costă - arcuri - maxim - evaluat - piste - total strategii combinate strategie model - cel mai mic număr de componente - curățare , - set suport - preferințe pentru monomii - comenzile , - simplificare - AF forme diagramă pentru descrierea stărilor tabelul de adevăr tautologie , termen ' Testul Turing ordonare dinamică - perfect comanda fix nivelul limită - lemn - negări factorul - ramificare eficientă funcția de calitate - Skolema -cost intenție constanta de caz special , - "general" - wildcard informații euristice - puterea , - functia , metode de căutare euristică căutare euristică sarcina elementară , Baza Herbran indicatoarele , rezolvator de probleme universal , Universul Herbrand unificator - cea mai comună (cea mai simplă) unificare V-ramură , AF-form sag cdr contra e-valori Pi-refutare CUPRINS Prefața editorului de traduceri Prefaţă ■ Capitolul Introducere unsprezece rezolvarea problemelor și inteligența artificială și Puzzle-uri și jocuri ca exemple de probleme State și Operatori Reducerea unei sarcini la subsarcini Utilizarea logicii formale la rezolvarea problemelor Cele două componente ale procesului de rezolvare a problemelor sunt: reprezentarea și căutare (forță brută) Note bibliografice şi istorice Sarcini Capitolul Reprezentarea sarcinilor în spațiul de stat Descrieri de stare Operatori Condiții țintă Înregistrarea ca grafic Reprezentarea spațiilor de stări cu programe nedeterministe Câteva exemple de vizualizări de sarcină Selectarea performanțelor "Bune" Note bibliografice şi istorice ' Sarcini capitolul Procese de căutare grafică Metode de forță brută Metoda de căutare în profunzime Modificări în enumerarea pe grafice arbitrare Discutarea informațiilor euristice Utilizarea funcţiilor de evaluare Algoritmul optim de enumerare Admisibilitatea algoritmului L* Optimitatea algoritmului * Forţa euristică a funcţiei P Rolul important al funcției £ Folosirea altor euristici Criterii de realizare a metodelor de enumerare Note bibliografice şi istorice Sarcini Cuprins capitolul Un exemplu de vedere care reduce o sarcină la subsarcini Descrierea sarcinilor Operatori pentru reducerea unei sarcini la subsarcini Descrierile sarcinilor elementare Coloane "ȘI/SAU" Reprezentarea graficelor "ȘI/SAU" utilizând programe nedeterministe Exemple de reducere a unei sarcini la un set de subsarcini Mecanisme de programare pentru reducerea sarcinilor la subsarcini Operatori cheie Diferențele Spații de stat de nivel superior Jocuri Note bibliografice și istorice Sarcini Capitolul Metode de căutare pentru reducerea sarcinilor la un set de subsarcini Procese de enumerare (căutare) pe grafice de tip "ȘI/SAU" Metoda forței brute Căutare în profunzime în primul rând Enumerarea pe grafice de tipul "ȘI/SAU" ' Costurile arborilor de decizie Utilizarea estimărilor de cost pentru enumerarea forței brute Algoritm de enumerare ordonat pentru arbori AND/OR ' Admisibilitatea algoritmului de căutare ordonată (căutare) Alegerea unui vârf în m pentru următoarea expansiune Modificări Procedura Minimax pentru enumerarea pe arbori de joc Procedura alfa-beta Eficienta enumerarii cu procedura alfa-beta Proceduri combinate alfa-beta și proceduri de secvențiere Posibilă îmbunătățire a metodelor bazate pe Minimax Note bibliografice şi istorice Sarcini ■ Capitolul Calculul cu predicate ca limbaj pentru rezolvarea problemelor ■ Sintaxă Semantică Variabile și cuantificatori Valabilitate și fezabilitate Sugestii Universul lui Herbrand Baza Erbran Construirea unui arbore semantic Vârfuri nefavorabile Vârfurile de ieșire Unificarea Rezoluţii Principiul rezoluției ' Consecvența și completitudinea rezoluției Note bibliografice şi istorice Sarcini Cuprins Capitolul Calculul predicatelor în rezolvarea problemelor Exemplu Procesul de extragere a răspunsului ' Ipoteze care conțin variabile referitoare la cuantificatorul universal Un exemplu de scriere automată a programelor Utilizarea calculului predicat pentru a rezolva problemele de stat-spațiu O formalizare pentru rezolvarea problemelor de stat-spațiu Note bibliografice și istorice Sarcini Capitolul Strategii de enumerare Strategii de simplificare Strategii de curățare ' Forme de probă cu filtrarea antecedentelor vârfuri Sprijinirea strategiei set Strategii mai restrictive Strategii model L-refutari Strategii combinate Strategii de ordonare Note bibliografice şi istorice Sarcini Bibliografie Index de nume Index DRAGA CITITORULE! Vă rugăm să trimiteți comentariile dvs despre conținutul cărții, designul acesteia, calitatea traducerii și altele la: Moscova, I- GSP Riga lane, , Editura Mir N Nilson INTELIGENŢĂ ARTIFICIALĂ Editori A S Popov și L B Steinpress Director artistic A I Goldman Editor artistic V I Shapovalov Editor tehnic L P Biryukova Coritor V S Sokolov Predată la platou la / , Semnat pentru tipărire la /VI, Tip hârtie Nr Х '/іб= , hârtie l conv cuptor l , , ed l Ed , Nr / Pret r, k Ordin Nr EDITURA "MIR" Moscova, prima bandă Riga, Ordinul Tipografiei Bannerului Roșu al Muncii Leningrad nr numit după Evgenia Sokolova іSoyuzpolgrafprom sub Comitetul de Stat al Consiliului de Miniștri al URSS pentru edituri, tipărituri și comerț cu carte Leningrad, L- , Izmailovsky Prospekt, AU NUMAI ABUNDANȚĂ PENTRU BOGAȚI ȘI LUMINĂM PENTRU ABUNDANȚĂ PENTRU TOȚI 